2016-03-02 4 views
0

J'utilise CRF POS Tagger en Python, en formant des corpus d'échantillons PTB en anglais et le résultat est assez bon.Comment ajouter des fonctionnalités spécifiques à CRF POS Tagger en Python?

Maintenant, je veux utiliser CRF pour m'entraîner sur un grand corpus vietnamien. J'ai besoin d'ajouter des fonctionnalités vietnamiennes dans ce tagueur comme nom propre, date-heure, nombre, ... J'ai essayé pendant des jours mais je n'arrive pas à comprendre comment faire ça. Je connaissais déjà le format des données donc ce n'est pas un problème.

Je suis assez nouveau pour Python. Donc, toute réponse détaillée peut être utile. Merci.

Répondre

0

Je recommande d'utiliser l'étiqueteuse CRF, c'est très facile.

+0

veuillez partager un exemple. – Sachith