Nous avons un client qui cherche un moyen d'importer et de classer une grande quantité de données textuelles. Ces données doivent être catégorisées et il a été suggéré que la façon la plus simple de le faire serait de regarder le champ description et d'essayer de faire correspondre les mots qui y sont contenus pour voir si une catégorie peut être dérivée pour cet enregistrement particulier.Recherche de texte de style synonyme et analyse
On a pensé que la meilleure façon de le faire serait de faire correspondre les mots avec les mots-clés détenus par chaque catégorie et si cela ne fonctionnait pas, d'utiliser une sorte de synonyme pour voir si cela pouvait être utilisé. Ainsi, par exemple, si un enregistrement particulier contenait le mot «automobile», alors une recherche de synonyme pourrait correspondre à ce mot au mot «voiture» qui serait retenu par rapport à la catégorie «véhicule».
Est-ce que quelqu'un connaît un service Web ou d'autres moyens de rechercher un dictionnaire pour trouver des synonymes pour un mot particulier? Le chef de projet a suggéré d'acheter une licence Google Enterprise Search pour cela, mais à partir de ce que je peux faire qui ne propose pas ce que ces gars-là recherchent.
Toutes les suggestions d'autres personnes pour obtenir le client ce qu'elles recherchent seraient acceptées avec reconnaissance.
Merci! Je vais regarder dans Wordnet.
Connaissez-vous d'autres types de logiciels de classification textuelle? Je vois qu'il y a une discussion sur l'utilisation d'algorithmes bayasiens pour cela, mais je ne peux pas en voir des exemples concrets.