J'ouvre un fichier en utilisant python pour trouver si un ensemble prédéfini de mots sont présents dans le fichier ouvert ou non. J'ai pris l'ensemble prédéfini de mots dans une liste et ouvert le fichier qui doit être testé. Maintenant, il existe une méthode pour extraire des mots en python plutôt que des lignes. C'est ce qui rend mon travail beaucoup plus facile.Extrait des mots d'un fichier
3
A
Répondre
7
import re
def get_words_from_string(s):
return set(re.findall(re.compile('\w+'), s.lower()))
def get_words_from_file(fname):
with open(fname, 'rb') as inf:
return get_words_from_string(inf.read())
def all_words(needle, haystack):
return set(needle).issubset(set(haystack))
def any_words(needle, haystack):
return set(needle).intersection(set(haystack))
search_words = get_words_from_string("This is my test")
find_in = get_words_from_string("If this were my test, I is passing")
print any_words(search_words, find_in)
print all_words(search_words, find_in)
retours
set(['this', 'test', 'is', 'my'])
True
1
Vous pouvez faire quelques petites choses
- file.readlines d'appel() et diviser le texte en entier sur votre delimiter désiré si votre texte n'est pas grand
- lecture d'appel() et de le faire à octets un temps
Vérifiez les pydocs pour le fichier - http://docs.python.org/release/2.5.2/lib/bltin-file-objects.html
1
Ce code montrera quels mots sont présents dans le fichier, étant donné que le mot correspond exactement, et i s n'est pas précédé ou suivi d'une ponctuation ou d'autres caractères, et est du même cas. Avec quelques ajustements mineurs, le code pourrait être rendu plus tolérant.
words = set(['hello', 'world', 'testing'])
f = open('testfile.txt', 'rb')
data = set(f.read().split())
print words.intersection(data)
Questions connexes
- 1. extrait des mots d'un fichier
- 2. mots Extrait sur un fichier texte
- 3. sed issue - Extrait des mots spécifiques du fichier
- 4. gsub extrait deux mots
- 5. Extrait 2 mots d'une chaîne
- 6. Extrait les mots environnants avec le match
- 7. Rails - extrait des mots-clés seo du bloc de texte
- 8. valeurs Extrait entre Open/Close Mots
- 9. balises extrait (mots) de chaîne entière
- 10. Extrait des données du fichier texte
- 11. Extrait des commentaires du fichier .cs
- 12. Extrait du fichier EXE
- 13. Extrait du fichier journal
- 14. Extrait pertinent Tag/Mots-clés de bloc de texte
- 15. mots-clés Extrait/balises de chaîne à l'aide preg_match_all
- 16. Extrait le fichier wav du fichier vidéo
- 17. Comptage des mots répétés dans un fichier
- 18. Remplacer des mots dans un fichier
- 19. Extrait les mots-clés du texte dans .NET
- 20. Extrait Keystore fichier du fichier apk
- 21. Extrait de fichier VOB (DVD)
- 22. mots Supprimer de fichier
- 23. Hadoop rechercher des mots d'un fichier dans un autre fichier
- 24. Extrait des informations de XML
- 25. Extrait des fichiers de NSDictionary
- 26. Extrait des classes css spécifiques dans un fichier
- 27. Extrait des balises d'un fichier html en utilisant Jsoup
- 28. extrait des images à partir d'un fichier vidéo en android
- 29. Extrait des coordonnées du fichier KML BatchGeo avec Python
- 30. extrait la liste des sous-répertoires du fichier d'entrée
une solution parfaite ... mais si le fichier est trop large..any sûr, plus intelligent solution – nikhil
(haussement) analyser la ligne de fichiers en ligne, accumulait le jeu de mots comme vous allez. –