2017-10-06 4 views

Répondre

2

Je cherchais quelque chose comme ça, aussi. Simplement pour un backend NLU "générique" (et donc pas très utile). La seule chose que j'ai trouvé jusqu'ici est un modèle entraîné avec 9 catégories de nouvelles (pas très génériques). Voir le billet du blog ici: http://eric-yuan.me/ner_1/

Si vous avez la possibilité de changer de NER, spaCy dispose d'un modèle entraîné disponible par défaut. Son front de visualisation peut être trouvé par google "displacy"

Si vous trouvez autre chose, faites le moi savoir!

EDIT: J'ai passé la journée à étudier la question et je pense avoir trouvé ce que vous cherchez. Si vous allez à https://github.com/mit-nlp/MITIE/releases, vous trouverez le propre modèle NER de MITIE formé sur Wikipedia, Freebase, etc. Le jeu de données d'entraînement réel est là aussi. Le fichier README sur leur page github fournit un exemple d'utilisation du modèle pré-entraîné. Vous pouvez également étudier le fichier ner.py dans le dossier examples pour voir comment utiliser le modèle pré-formé dans le code python.

+0

Merci beaucoup. Je vais commenter ici si je trouve un autre jeu de données utile. –

+0

J'ai essayé de créer mon propre ensemble de données avec des entités étiquetées en regroupant les vecteurs de gant et en étiquetant chaque groupe avec un nom. Pensez-vous que c'est une approche correcte? –

+0

Cela ressemble à ça, mais je n'ai pas encore joué avec ce genre de choses pour être sûr. Et il semble que je ne reviendrai pas là-dessus pour un moment parce que j'ai été affecté à un autre projet. Vous êtes seul pour le moment. Pardon :( –