2011-12-08 2 views
0

J'essaie de faire un outil de recherche qui chercherait un petit nombre d'objets (environ 1000, chacun avec environ 3 champs de texte que je veux rechercher) pour une phrase donnée. J'essayais de trouver un algorithme qui classerait les résultats de recherche pour moi. Beaucoup de sujets mènent à l'appariement flou, et à l'algorithme de distance de Levenshtein, mais cela ne semble pas approprié pour ce cas (par exemple, il dirait que l'expression «chats et chiens» est plus proche de «voitures et rouages» que "chiens et chats"). Existe-t-il un algorithme/méthode dédié à l'appariement d'une phrase de recherche avec d'autres blocs de texte et classant les résultats selon des choses comme le texte étant égal, la phrase de recherche contenue, les mots individuels étant contenus, etc. Je ne sais même pas ce qui est normalement approprié.Existe-t-il un algorithme/une méthode de recherche qui associe des phrases?

Je code habituellement en C#. Je n'utilise pas de base de données.

+0

Vous avez besoin de corrélations statistiques de style Google. Avez-vous beaucoup de données à former avec? 1000 objets n'est pas beaucoup de données d'entraînement. –

Répondre

0

Regardez Lucene. Il peut effectuer toutes sortes d'indexation de texte, retourner des résultats classés, et beaucoup d'autres bonnes choses. Il y a une implémentation en C#. Cela peut être un peu exagéré pour votre cas d'utilisation, mais c'est une technologie tellement excellente et utile que vous devriez vraiment y jeter un coup d'œil, il est presque certain que vous y trouverez un bon usage pendant votre carrière.

Questions connexes