0

Je viens de passer les derniers jours à mettre en œuvre l'analyse sémantique latente pour les documents indexés dans elasticsearch. la première étape est de construire la matrice term-document.So je pense à utiliser stanford nlp bibliothèque qui prend en entrée l'index Signification minuscules, en supprimant les mots vides, peut-être retomber et générer la matrice ou il est simplement possible d'utiliser elasticsearch java api il?Implémentation de LSA pour l'index de recherche élastique

Répondre

0

Oui, vous pouvez utiliser _analyze point d'extrémité de elasticsearch et faire tokenizing/character mapping/stemming/... sur votre texte et obtenir le résultat.