Je souhaite rechercher les permutations qui correspondent à un mot donné et organiser mes données en fonction de la position de la colonne.Rechercher une permutation similaire d'un mot dans une autre colonne
IE - J'ai créé un fichier CSV avec les données que je mis au rebut de plusieurs websites.Say il ressemble à ceci:
Name1 OtherVars Name2 More Vars
Stanford 23451 Mamford No
MIT yes stanfor1d 12
BeachBoys pie Beatles Sweeden
Je veux (1) trouver des permutations de chaque mot de Name1 dans Nom2, puis (2) imprimer une table avec ce mot de Name1 + c'est mot correspondant dans OtherVars + la permutation de ce mot dans Name2 + c'est match dans MoreVars. (si aucune correspondance trouvée, il suffit de supprimer le mot).
Le résultat sera dans ce cas:
Name1 OtherVars Name2 More Vars
Stanford 23451 stanford 12
Alors, comment puis-je:
Trouver des permutations correspondant à un mot dans un autre colonne?
Imprimer les 2 mots et les valeurs auxquels ils sont mappés dans d'autres colonnes?
PS - voici une question similaire; Cependant, c'est Java et c'est un pseudo code. How to find all permutations of a given word in a given text? difflib ne semble pas convenir à CSVs basé sur ce: How to find the most similar word in a list in python
PS2 - On m'a conseillé d'utiliser Fuzzymatch
cependant, je pense que c'est un surpuissant dans ce cas.
Est-ce que la deuxième entrée dans 'Name2' est supposée avoir un 1 dedans? – marisbest2
Aussi, qu'est-ce qu'une "permutation" dans ce cas et comment définissez-vous "similaire"? – marisbest2
Oui @ marisbest2 le 1 signifiait être là. Les permutations seraient définies comme assez similaires, ce qui pourrait utiliser la distance de Levenshtein, ou mieux, la fonction définie par l'utilisateur. – oba2311