Je dois souvent rechercher beaucoup de mots (1000+) dans de nombreux documents (millions +). J'ai besoin de la position du mot correspondant (si apparié).Recherche de nombreuses expressions dans de nombreux documents en utilisant Python
version pseudo lent code Donc est
for text in documents:
for word in words:
position = search(word, text)
if position:
print word, position
Yat-il un module Python rapide pour le faire? Ou devrais-je implémenter quelque chose moi-même?
Des millions de documents pour des milliers de mots? Pourquoi pensez-vous que votre solution serait meilleure que les dizaines de solutions disponibles? Des millions de documents ne sont pas triviaux. – Falmarri
@Falmarri: Je pense que le but de la question est de trouver une de ces dizaines de solutions sous forme de module Python. – nmichaels
Donc, fondamentalement, vous voulez juste un index en texte intégral? –