2016-06-12 1 views
0

Nous sommes des étudiants CS et nous travaillons sur un système de recommandation pour notre GP. Notre ensemble de données contient les utilisateurs et les lieux qu'ils ont visités, nous voulons utiliser la PNL pour traduire ces lieux en activités. ex. (Mall -> Shopping, Club -> Jouer ...) et ainsi de suite. et aussi si les utilisateurs écrivent un commentaire, nous pouvons savoir quel genre d'activité ils font.Utilisation de la PNL pour extraire des informations des enregistrements et des commentaires

Nous sommes un peu perdus à ce stade et je veux savoir d'où devrions-nous commencer ou que devrions-nous commencer à chercher?

Merci.

Répondre

1

Comme la plupart des problèmes de ce type, il y a deux voies:

écrit à la main:

Le serait à la main coût initial plus bas encore approche moins évolutive définissent les actions associées à chaque emplacement votre jeu de données et stockez-les dans un dictionnaire. Si le nombre d'emplacements uniques est faible, vous pouvez probablement lancer toutes les actions associées avec peu d'effort. Des services Tâches-à-embaucher comme Mechanical Turk pourraient également être utilisés (vous voudriez probablement agréger plusieurs réponses pour chaque emplacement afin de filtrer les associations de faible qualité).

machine Extrait:

L'autre approche serait d'utiliser un algorithme de PNL pour apprendre/extraire l'emplacement approprié en fonction d'un nombre important d'exemples. Si aucun jeu de données satsifactory n'existe, vous devrez créer le vôtre (ce qui est tout aussi important que la première approche). Une fois que vous avez un corpus, vous devrez faire un peu d'étiquetage de rôle sémantique, une bonne introduction peut être trouvée here.