2010-01-14 1 views
-1

Je voudrais être capable de comparer un fichier binaire X à un répertoire d'autres fichiers binaires et de trouver quel autre fichier est le plus proche de X. La nature des données est telle que les morceaux identiques existeront entre les fichiers, mais éventuellement décalés dans l'emplacement. Les fichiers ont une taille de 1 Mo et ils sont environ 200. Je voudrais avoir quelque chose de suffisamment rapide pour les analyser en quelques minutes ou moins sur un ordinateur de bureau moderne. J'ai cherché un peu sur google et trouvé quelques utilitaires différents, mais aucun d'entre eux ne semble approprié pour mon application. Par exemple, il y a bsdiff, qui ressemble à créer un fichier patch qui est optimisé pour la taille. Ou vbindiff qui affiche simplement les différences graphiquement, mais ceux-ci ne semblent pas vraiment m'aider à comprendre si un fichier est plus similaire à X qu'un autre fichier.Utilitaires ou bibliothèques pour trouver le fichier binaire le plus proche

S'il n'y a pas un outil que je puisse utiliser directement à cette fin, y a-t-il une bonne bibliothèque que quelqu'un pourrait recommander pour écrire mon propre utilitaire? Python serait préférable, mais je suis flexible.

Répondre

Questions connexes