J'ai un tas de fichiers et de catégories répertoriés dans cats.txt dans le même dossier. Je veux créer un lecteur classé par catégorie pour cela. Comment créer un lecteur de corpus étiqueté catégoriel
Voici à quoi ressemblent mes fichiers.
Essayé de nombreuses façons dans nltk et n'a pas réussi à créer Categorizedtaggedcorpusreader, Inside mon cats.txt j'ai nom de fichier et le nom de la catégorie avec un espace à part, chaque nom de fichier peut avoir plusieurs catégories.
Par exemple:
adaptateur mail_1_adapter
mail_1_alert alerte
messagebody_24862499 autres
etc ...
Pouvez-vous s'il vous plaît me montrer une meilleure façon où je peux créer mon corps et nous faire de il.
corpus_root = 'C:/Users/nkumarn/PycharmProjects/taggedcorpus /' ___________________________________ lecteur = CategorizedTaggedCorpusReader (corpus_root, r, de cat_file = r '* \ fichier..' '* \ Txt..) cette C'est ce que j'ai fait. Cela n'a pas marché –
Eh bien, pas de surprise, ça n'a pas marché. 'cat_file' devrait être un nom de fichier (avec path), pas une expression régulière. Et as-tu vraiment écrit 'r '. * \. File'' comme modèle de fichier? La prochaine fois, incluez votre code et l'erreur que vous avez dans votre question. Arrêtez d'écrire de telles questions paresseuses, ce n'est pas la première question que je vous ai conseillé d'améliorer. – alexis
Ya je l'ai eu Merci ... Je vais certainement améliorer mes normes d'interrogation. Merci pour le conseil. –