1

Essayer d'exploiter la puissance de l'API Google Prediction pour classer mes données. Chaque élément de ma base de données peut être associé à plusieurs catégories.API de prédiction Google - Syntaxe des données d'apprentissage pour la multi-classification

Par exemple: "My Nexus phone is rebooting constantly" pourrait être attribué à la fois #Android et #troubleshooting tags.

Je souhaite télécharger mes données d'entraînement sur Google, mais je ne suis pas sûr de savoir comment appliquer les deux balises au même contenu. Dans ce qui suit example que j'ai trouvé la syntaxe qui fournissent une catégorie pour chaque contenu comme ceci:

"Android", "My Nexus phone is rebooting constantly"

Quelle est la bonne syntaxe des données de formation multi-classification?

Répondre

0

De la documentation:

Chaque ligne ne peut avoir one label assigned, mais vous pouvez appliquer plusieurs étiquettes à un exemple par repeating an example and applying different labels to each one. Par exemple:

"excité", "OMG! Juste eu une fabuleuse journée!"

"ennuyeux", "OMG! Juste eu une fabuleuse journée!"

Si vous envoyez un tweet à ce modèle, vous pourriez obtenir une classification comme ceci: "excited": 0.6, "ennuyeux": 0.2.

0

À moins que je ne comprenne quelque chose de votre question, je pense que la réponse est dans les documents here. En d'autres termes, la section sur les chaînes de texte explique que lorsque vous soumettez une chaîne de texte, le système la découpe en plusieurs chaînes, en séparant tout en utilisant des espaces comme délimiteur. Ils indiquent "Godzilla vs Mothra" pour être "Godzilla", "vs" et "Mothra". Donc, dans votre cas, vous pouvez simplement utiliser "Dépannage Android". Le système va le séparer en "Android" et "dépannage".