2011-06-29 2 views
-2

J'ai deux grands fichiers texte (environ 1,8 Go chacun codé en UTF-8). Et je veux vérifier si le contenu des deux fichiers est 100% identique. S'il existe une différence de caractère unique, elle est considérée comme non identique, c'est-à-dire que les deux fichiers sont différents. Comment je fais ça?Comment vérifier si 2 grands fichiers texte sont 100% identiques?

Donc, ma question est: Comment vérifier si 2 gros fichiers texte sont 100% identiques?

Dim TextFile1 as String = "C:\TextFile1.log" 
Dim TextFile2 as String = "C:\TextFile2.log" 

MISE À JOUR:

J'ai oublié d'ajouter, la solution devrait utiliser la mémoire minimale parce que le PC spécifique n'a que la mémoire 256 Mo

Répondre

1

Eh bien, pour commencer, vous pouvez comparer leur taille (s'ils ne sont pas de la même taille, ils ne peuvent pas avoir le même contenu). Regardez la propriété FileInfo.Length pour cela.

S'ils ont la même taille, vous pouvez compare them byte by byte

+0

S'il s'agit d'un texte, vous devez comparer les caractères les uns après les autres en tenant compte des codages. – Joey

+0

Le code sur votre deuxième lien fait déjà la comparaison de la taille du fichier. – Joey

1

J'ai couru dans un problème similaire où je avais besoin pour identifier les fichiers en double pdf qui ont les noms ont changé. La meilleure façon de le faire était d'utiliser le hachage md5. J'ai fait une recherche google rapide et il semble que vb.net ait un support intégré pour ce faire. Check out http://www.vbknowledgebase.com/?Id=88&Desc=Find-Duplicate-files-using-Vb.Net-using-MD5-Hash

+0

Si vous comparez seulement deux fichiers, le calcul de leur checksum n'a absolument aucun avantage sur la comparaison directe. –

Questions connexes