2009-05-03 12 views
3

Je suis nouveau dans le domaine de la correspondance approximative de chaînes.Surmonter la longueur du motif de recherche de l'algorithme Bitap

J'explore des utilisations pour le Bitap algorithm, mais jusqu'ici sa longueur limitée de modèle m'a troublée. Je travaille avec Flash, et je dispose d'entiers non signés de 32 bits et d'un type de nombre à virgule flottante double précision IEEE-754, qui peut consacrer jusqu'à 53 bits pour les entiers. Pourtant, je préfère avoir un algorithme de correspondance floue qui peut gérer des motifs plus longs que 50 caractères. L'algorithme de l'algorithme Bitap mentionne libbitap, qui suppose une implémentation illimitée de l'algorithme, mais j'ai du mal à extraire l'idée de ses sources. Avez-vous des suggestions sur la façon de généraliser Bitap pour les motifs de longueur illimitée, ou sur un autre algorithme qui peut effectuer une chaîne floue correspondant à une aiguille près d'un emplacement suggéré dans la meule de foin?

Répondre

2

Il existe une implémentation de cet algorithme assez disponible à google code. Essayez-le. Bien que je ne peux pas comprendre comment obtenir un emplacement exact (le début et la fin du texte) de correspondance floue. Si vous avez une idée de comment obtenir les deux points de début et de fin, s'il vous plaît partager.

+0

C'est de là que j'ai commencé. Ils travaillent autour du problème de longueur limitée en effectuant plusieurs recherches au lieu d'utiliser une implémentation de longueur illimitée. – Hristo

Questions connexes