J'ai récemment commencé un voyage en PNL en utilisant SpaCy, et j'ai ~ 5.500 chaînes que je veux étiqueter. Pour les 100 premiers, je l'ai fait en utilisant une feuille de calcul avec des colonnes personnalisées, qui a ensuite été exécuté à travers un script pour générer des dictionnaires Python. Dans la feuille, j'ai strored la chaîne, le type d'étiquette, la valeur d'étiquette. Le script calcule ensuite la position de la valeur de l'étiquette dans la chaîne.Méthodes de création de données d'entraînement pour les modèles SpaCy?
Les données d'apprentissage de ce produit prennent beaucoup de temps et sont susceptibles d'erreurs.
Existe-t-il des outils disponibles pour vous aider? J'ai juste besoin littéralement de mettre en évidence une sous-chaîne, puis de choisir le type d'étiquette. Je pourrais le construire moi-même, mais je pense qu'il pourrait déjà exister.
Hey Ines, merci pour la réponse. Je me suis inscrit à la bêta hier, en attendant d'être accepté. –
Ah cool! Nous avons envoyé des invitations dans des lots plus petits pour nous assurer que nous pouvons corriger les bogues rapidement. Si vous le souhaitez, vous pouvez m'envoyer un e-mail afin que je sache qui vous êtes et que je puisse m'assurer que nous vous ajoutions au prochain lot d'invitations :) –
Génial, email envoyé. Je vous remercie! –