Je cherche une bibliothèque qui me permettrait de faire quelque chose comme ce qui suit:recherche Python texte bibliothèque
matches(
user_input="hello world how are you what are you doing",
keywords='+world -tigers "how are" -"bye bye"'
)
Fondamentalement, je veux le faire correspondre les chaînes en fonction de la présence de mots, l'absence de mots et de séquences de mots . Je n'ai pas besoin d'un moteur de recherche à la Solr, car les chaînes ne seront pas connues à l'avance et ne seront recherchées qu'une seule fois. Une telle bibliothèque existe-t-elle déjà et, si oui, où la trouverais-je? Ou suis-je voué à la création d'un générateur regex?
essayez nltk.org. Thats la bibliothèque de traitement de langage naturel pour python – Kelvin
Vous ne savez pas quelle taille de données vous voulez correspondre, mais Lucene/Solr est la meilleure option pour une application à plus grande échelle - http://lucene.apache.org/solr/. Regardez aussi [pysolr] (https://github.com/toastdriven/pysolr). –
Je cherche à faire correspondre de très petites quantités de données: des chaînes de moins de 100 mots utilisant des règles de mots-clés de quelques mots seulement. Une fois l'appariement terminé, je n'ai plus d'utilité pour la chaîne d'origine, donc je ne pense pas que Solr soit ce dont j'ai besoin. Je n'ai pas non plus besoin que la recherche soit floue ou spécifique à une langue. – ipartola