J'ai des ensembles de données. Le premier (A) est une liste d'équipement avec des noms sophistiqués. La seconde est une liste de catégories d'équipement plus larges (B) - à laquelle je dois regrouper la première liste en utilisant des comparaisons de chaînes. Je suis conscient que ce ne sera pas parfait.Comparaison de chaînes pour plusieurs valeurs python
Pour chaque entité de la liste A - Je souhaite établir la distance levenshtein pour chaque entité de la liste B. L'enregistrement de la liste B ayant le score le plus élevé sera le groupe auquel j'attribuerai ce point de données.
Je suis très rouillé en python - et je joue avec FuzzyWuzzy pour obtenir la distance entre deux valeurs de chaîne. Cependant, je n'arrive pas à comprendre comment parcourir chaque liste pour produire ce dont j'ai besoin.
Je supposais que je créerais simplement une liste pour chaque ensemble de données et écrirais une boucle assez simple pour chacun - mais comme je l'ai dit je suis un peu rouillé et ne pas avoir de chance.
Toute aide serait grandement appréciée! S'il y a un autre paquet qui me permettra de faire ceci (pas Fuzzy) - je suis heureux de prendre des suggestions.
Regardez ceci, ça va aider beaucoup. Ned Batchelder - Loop comme un natif: tandis que, pour, itérateurs, générateurs https://www.youtube.com/watch?v=EnSu9hHGq5o – diek