2009-10-28 5 views

Répondre

5

Alternativement, R a de nombreux outils disponibles pour l'exploration de texte, et il est facile de integrate with Python using RPy2.

Regardez le Natural Language Processing view on CRAN. En particulier, regardez le package tm. Voici quelques liens pertinents:

En plus , R fournit de nombreux outils pour analyser HTML ou XML. Avoir a look at this question for an example using the RCurl and XML packages.

3

Pourriez-vous s'il vous plaît fournir plus d'informations pourquoi NLTK est insuffisante ou quelles sont les fonctionnalités dont vous avez besoin de considérer un cadre le «meilleur»?

Néanmoins, il existe la bibliothèque d'analyse lexicale shlex intégrée.

Il existe également un livre récent sur le sujet, Natural Language Processing with Python. Il semble qu'au moins une partie couvre NLTK. Vous pouvez également consulter cette liste de tutoriels et de bibliothèques sur le site Web awaretek, qui pointe également vers le framework NLQ.py.

Natural Language Processing with Python http://ecx.images-amazon.com/images/I/41NBqj7NyGL._BO2.jpg

+0

Il utilise NLTK tout au long et est un excellent livre si vous voulez faire PNL avec python, comme son nom l'indique! :) – ealdent

Questions connexes