À utiliser pour analyser des documents sur Internet!En plus de NLTK, quelle est la meilleure bibliothèque de récupération d'informations pour Python?
Répondre
Alternativement, R a de nombreux outils disponibles pour l'exploration de texte, et il est facile de integrate with Python using RPy2.
Regardez le Natural Language Processing view on CRAN. En particulier, regardez le package tm
. Voici quelques liens pertinents:
- papier sur le paquet dans le Journal of Statistical Computing: http://www.jstatsoft.org/v25/i05/paper. Le document comprend un bel exemple d'une analyse de la R-devel liste de diffusion (https://stat.ethz.ch/pipermail/r-devel/) envoi de messages de 2006.
- page d'accueil du paquet: http://cran.r-project.org/web/packages/tm/index.html
- Regardez la vignette d'introduction: http://cran.r-project.org/web/packages/tm/vignettes/tm.pdf
En plus , R fournit de nombreux outils pour analyser HTML ou XML. Avoir a look at this question for an example using the RCurl
and XML
packages.
Pourriez-vous s'il vous plaît fournir plus d'informations pourquoi NLTK est insuffisante ou quelles sont les fonctionnalités dont vous avez besoin de considérer un cadre le «meilleur»?
Néanmoins, il existe la bibliothèque d'analyse lexicale shlex intégrée.
Il existe également un livre récent sur le sujet, Natural Language Processing with Python. Il semble qu'au moins une partie couvre NLTK. Vous pouvez également consulter cette liste de tutoriels et de bibliothèques sur le site Web awaretek, qui pointe également vers le framework NLQ.py.
Natural Language Processing with Python http://ecx.images-amazon.com/images/I/41NBqj7NyGL._BO2.jpg
- 1. quelle est la meilleure/plus facile à utiliser bibliothèque de chiffrement en python
- 2. Quelle est la meilleure bibliothèque alternative pour gettimeofday() en C++?
- 3. Quelle est la meilleure bibliothèque de vérification orthographique pour C#?
- 4. Quelle est la meilleure bibliothèque OAuth2 C#?
- 5. Quelle est la meilleure bibliothèque Java OXM?
- 6. Quelle est la meilleure bibliothèque pour manipuler les métadonnées JPEG?
- 7. Quelle est la bibliothèque XML la plus utilisée pour C++?
- 8. Quelle est une meilleure façon de gérer cela en Python
- 9. Quelle est la meilleure bibliothèque graphique 2D pour Windows Mobile?
- 10. Quelle est la meilleure bibliothèque pour gérer une wiimote?
- 11. Quelle est la meilleure bibliothèque d'API Twitter pour Actionscript?
- 12. Quelle est la meilleure bibliothèque EXIF pour .Net?
- 13. Quelle bibliothèque graphique est la meilleure pour Linux embarqué?
- 14. Quelle est la meilleure solution pour le regroupement de connexions de bases de données en python?
- 15. Quelle est la bibliothèque de programmation génétique la plus active?
- 16. Quelle est la meilleure façon de faire la manipulation de champ de bits en Python?
- 17. En Python, quelle est la différence entre la 'bibliothèque urllib' et la 'bibliothèque de socket'?
- 18. Quelle est la meilleure méthode python pour le chiffrement
- 19. Quelle est la meilleure façon de créer une bibliothèque client pour une API de service Web?
- 20. Quelle est la meilleure façon d'implémenter la récupération de mot de passe dans une perspective d'utilisabilité?
- 21. Quelle est la meilleure façon d'écrire une application Python GTK +?
- 22. Quelle est la meilleure mise en page pour une application de ligne de commande python?
- 23. La bibliothèque DNS la plus rapide pour python
- 24. Python: quelle bibliothèque d'analyse XML fonctionnera dès la sortie de Python 2.4 et plus?
- 25. Quelle est la meilleure infrastructure de bibliothèque de prise en charge de la connectivité de base de données pour C++?
- 26. Quelle est la meilleure bibliothèque de skinning gratuite pour Windows Forms?
- 27. Quelle est la meilleure bibliothèque Diff dans Ruby?
- 28. Quelle est la meilleure structure pour implémenter une carte d'identité?
- 29. Quelle est la meilleure bibliothèque .Net XML-RPC?
- 30. Analyse avancée de PDF à l'aide de Python (extraction de texte sans tableaux, etc.): Quelle est la meilleure bibliothèque?
Il utilise NLTK tout au long et est un excellent livre si vous voulez faire PNL avec python, comme son nom l'indique! :) – ealdent