Je veux construire des corpus pos tagged avec NLTK. Alors que je peux former mon modèle basé dessus.créer corpus pos tagué avec NLTK
Jusqu'à présent, j'ai mentionné de nombreuses sources, mais chacun simplement expliquer à la façon de lire votre corpus étiqueté et lecture de mots, des phrases, etc. Voici un morceau de code que j'ai essayé:
from nltk.corpus.reader import TaggedCorpusReader
reader = TaggedCorpusReader('/home/abc/nltk_data/', 'pos_tagged.pos')
reader.words()
reader.tagged_words()
reader.sents()
Je veux inclure mon corpus dans le dossier home/nltk_data/corpora/
afin que je puisse importer le corpus que j'ai créé. S'il vous plaît me guider.