2016-05-02 2 views

Répondre

1

Ce que vous avez décrit ressemble plus à un projet de recherche. :-)

Si ce ne sont que des mots, pas des phrases, la technologie la plus récente est l'intégration de mots. On peut y voir une conversion de mots en vecteurs de grande dimension (de 200 à 1000 dimensions) en formant des millions de documents.

https://code.google.com/archive/p/word2vec

Le code a été archivé pour les questions de propriété, mais vous pouvez toujours télécharger et exécuter pour vous-même. Bonne chance.