2015-10-07 2 views
0

J'ai un grand nombre de séquences de données étiquetées et je voudrais utiliser Deep Learning pour les classer. Par exemple: je n fichiers (f3 ... f1 f2 fn) Chacun a un très grand nombre de séquences:Utilisation de Deep Learning pour les données séquentielles

f1

0 15 0 0 0 2 ...

0 2 4 4 4 8 ...

1 0 0 5 7 8 ...

0 3 5 0 6 22 ...

f2

0 0 0 0 1 0 ...

1 0 3 0 5 0 ...

3 0 0 0 11 4 ...

2 0 7 8 1 3 ...

Maintenant pour une séquence donnée (par exemple: 1 4 3 0 0 0 0 ....), le programme (apprentissage en profondeur) devrait être capable de le classer dans le bon fichier. Pourriez-vous expliquer dans easy_to_understand comment aborder ce problème en utilisant l'apprentissage en profondeur? Je prévois d'utiliser R et/ou Python. Je serai très heureux d'entendre parler de certaines bibliothèques d'apprentissage en profondeur utiles pour de tels problèmes.

+0

Theano, Torche, DeepLearning4j, 0xData-H2o, Berkeley Caffe – m02ph3u5

+0

Quelles sont les étapes à suivre pour résoudre ce problème en utilisant une ou plusieurs de ces bibliothèques? –

Répondre

0

Pas sûr si ce problème a vraiment besoin de ML (ou même d'apprentissage en profondeur) pour résoudre. Si vous pouvez trouver une séquence unique de chaque fichier, alors un simple mapping peut faire le travail (puisque vous avez dit "Chacun a un très grand nombre de séquences"). Si ce n'est pas le cas, alors il s'agit d'un classification problem. En un mot, dans le problème de la classification, nous apprenons le modèle de X pour prédire y. Dans votre cas, X serait la séquence dans un fichier, y serait le nom du fichier. Avant d'aller dans l'apprentissage en profondeur, je vous recommande de jeter un oeil à here.

0

Essayez d'utiliser LSTM pour cette tâche. La tâche séquentielle est une utilisation naturelle de LSTM. Par exemple, le son est un phénomène séquentiel et la reconnaissance vocale moderne (google, microsoft, baidu) utilise LST pour cette tâche.