J'ai un très gros fichier CSV contenant seulement deux champs (id, url). Je veux faire de l'indexation sur le champ url avec python, je sais qu'il y a des outils comme Whoosh ou Pylucene. mais je ne peux pas obtenir les exemples pour travailler. Quelqu'un peut il m'aider avec ça?Indexation du contenu d'un fichier CSV en Python
Répondre
contenu file.csv:
a,b
d,f
g,h
script Python qui charge le tout dans un dictionnaire géant:
#Python 3.1
giant_dict = {id.strip(): url.strip() for id, url in (line.split(',') for line in open('file.csv', 'r'))}
print(giant_dict)
{'a': 'b', 'd': 'f', 'g': 'h'}
Cher seigneur, pourquoi vous l'analyse vous-même au lieu d'utiliser le module CSV ?? – moshez
le problème est que ce fichier sera plus de 5 Go. donc je ne peux pas le charger dans la mémoire à la fois! – Hossein
Qu'essayez-vous exactement de faire? Vous pouvez lire le fichier ligne par ligne avec ceci: pour line in open ('file.csv'). Aussi, pourquoi ne pas simplement installer 9 Go ou RAM? –
PyLucene est très facile de travailler avec, mais comme vous l'avez pas encore posté de votre Par exemple, je ne suis pas sûr du problème auquel vous faites face.
Alternativement, lorsque vous avez seulement la clé: type valeur de données, peut-être mieux que Pylucene serait DB comme Berkeley DB (bindings python pybsddb). Cela fonctionnera comme un dictionnaire python et devrait être plus ou aussi rapide que lucene, vous pouvez essayer cela.
- 1. CSV Contenu du fichier Affichage Problème
- 2. Indexation du contenu multilingue avec Lucene.net
- 3. Indexation et recherche de fichier Python
- 4. Modifier un fichier csv en Python
- 5. python en-têtes csv
- 6. Comment lire un fichier csv avec python
- 7. indexation et recherche de contenu dans le dossier du projet
- 8. Contenu du fichier au format d'arbre en utilisant python
- 9. Tri et alignement du contenu d'un fichier texte en Python
- 10. Indexation du référentiel CVS
- 11. Convertir le fichier .csv en .dbf en utilisant Python?
- 12. append contenu d'un fichier csv à un autre en utilisant python
- 13. Modification du contenu du fichier XML avec Python
- 14. script Python lecture d'un fichier csv
- 15. lecture colonne de fichier csv et l'extraction en utilisant python
- 16. Créer un utf-8 fichier csv en Python
- 17. validation du fichier CSV avec Java
- 18. Liste au format CSV en Python
- 19. Python csv sans tête
- 20. Tags csv Python
- 21. comment fusionner 200 fichiers CSV en Python
- 22. Convertir une liste Python en colonne CSV
- 23. Indexation en cluster
- 24. csv à la matrice clairsemée en python
- 25. Comment convertir tab séparé, format de fichier CSV en Python en Python
- 26. questions python csv
- 27. articles reformater intérieur liste de lecture à partir du fichier CSV en Python
- 28. Python - le contenu du fichier à la liste imbriquée
- 29. Conversion de fichier PST en fichier CSV
- 30. Ruby: Comment modifier le contenu d'un fichier CSV?
Que voulez-vous dire par indexation? –