-3

J'essaie de faire une tâche de classification binaire sur un ensemble de phrases qui sont si proches les unes des autres. Mon problème est que je ne suis pas sûr de savoir comment traiter ce problème avec une telle similitude entre les échantillons. Voici quelques-unes de mes questions:Tâche de classification binaire sur des modèles très similaires

(1). Quelle technique de classification sera la plus appropriée dans ce cas?

(2). Est-ce que l'aide à la sélection de fonctionnalités sera dans ce cas?

(3). Des algorithmes de classification des séquences, basés sur le réseau neuronal récurrent (LSTM), pourraient-ils être une approche potentielle à suivre?

Je serai heureux de voir toute suggestion ou aide concernant ce problème, merci!

+0

Je suis surpris! Pourquoi moins marquer? Quel est le problème avec la question? Peut-être que je dois considérer les algorithmes de classification plutôt que ceux de classification? – Goli

+0

Je suppose que la notation est parce que ce type de questions n'est pas approprié pour SO, voir les [directives] (https://stackoverflow.com/help/on-topic). Je vous suggère d'essayer [Cross Validated] (https://stats.stackexchange.com/) – ncfirth

+0

Merci @ncfirth! J'ai changé le sujet. – Goli

Répondre

0

(seulement une réponse potentielle à 3) En supposant que vous ne devez classer que s'ils sont dans une certaine catégorie, vous ne voudriez pas utiliser les RNN, à moins que vous ne vouliez en faire quelque chose de nouveau (séquence à -Séquence)

cela dit, il est possible de classer si vous finissez avec une séquence et une planeuse couche entièrement connecté

+0

Merci pour votre réponse Mes échantillons de données sont des phrases (courte phrase) et l'étiquette de classe est 0 ou 1. Donc, en fait, je vais utiliser RNN pour construire un modèle prédictif plutôt qu'un modèle génératif. – Goli