2008-09-22 6 views
3

J'ai deux fichiers (f1 et f2) contenant du texte (ou des données binaires).
Comment puis-je trouver rapidement des blocs communs?Recherche de blocs communs

par exemple.
f1: ABC DEF
f2: XXABC XEF

sortie:

blocs communs:
longueur 4: "ABC" dans f1 @ 0 et f2 @ 2 longueur 2: "EF" dans f1 @ 5 et f2 @ 8

+0

Vous semblez regrouper les éléments ('ABC', puis 'DEF'), les parties communes sont dans les mêmes groupes. Est-ce exprès? –

Répondre

1

Wikipédia a une pseudocode pour trouver le plus commun entre t substring wo séquences de données. Dans votre cas, vous extrayez simplement toutes les sous-chaînes courantes de la table qui ne sont pas des préfixes d'autres sous-chaînes courantes (c'est-à-dire des sous-chaînes communes maximales).