2010-06-16 4 views
2

Étant donné un texte libre, j'ai besoin d'analyser ce texte et de suggérer une liste d'étiquettes à partir d'une liste préexistante.
Quels algorithmes existent sur le marché? Peuvent-ils traiter un cas où, par exemple, le texte ont un mot commeAlgorithme pour suggérer une liste d'étiquettes aux utilisateurs

taux de cholestérol élevé

et je voudrais tellement suggérer

maladie cardiaque

bien que «l'hypercholestérolémie» puisse ne pas exister (initialement) dans la liste prédéfinie.

+0

"l'hypercholestérolémie" peut ne pas exister (initialement) dans la liste prédéfinie, mais elle doit exister avant que la suggestion puisse être faite (au moins, le mot cholestérol doit exister). Je ne vois pas comment cela pourrait être totalement dynamique. –

+0

@Khnle juste une pensée, les premières fois que les gens entrent Choles 'il ne serait pas connecté, mais le système verra que la maladie de Choles et Hart apparaissent ensemble et fera la connexion pour les utilisateurs plus tard. –

+0

mais comment le programme sait-il faire cette connexion? Pourquoi le programme ne fait-il pas le lien entre le cholestérol et la grippe, par exemple? –

Répondre

0

Il semble que vous ayez besoin d'une relation plusieurs-à-plusieurs entre les mots-clés (texte libre) et votre liste de mots-clés. De cette façon, vous pouvez appliquer toutes les associations correctes.

L'ordinateur lui-même ne sera pas assez intelligent pour savoir que high cholesterol et heart disease sont liés sans que quelqu'un ne définisse d'abord la relation dans une base de données.

0

Il existe des bases de données pré-existantes & plug-ins pour des sujets connexes & recommandations tag - vérifier certaines de ces:

Autotags (js)

Yahoo Terme extracteur

OpenCalais

Il y a aussi plenty of services pour l'achèvement automatique/Suggest. Vous pouvez également envisager une requête sur Twitter // l'API de certains autres médias sociaux pour trouver des balises basées sur du texte.

Questions connexes