Nous avons un dossier de données de 150 Go. Dans ce cadre, le contenu du fichier est de n'importe quel format (doc, jpg, png, txt, etc.). Nous devons vérifier tous les contenus de fichiers les uns par rapport aux autres pour vérifier s'il y a du contenu de fichier en double. Si c'est le cas, imprimez la liste des noms de chemin d'accès au fichier. Pour cela, j'ai d'abord utilisé ArrayList<File>
pour stocker tous les fichiers, puis utilisé la méthode FileUtils.contentEquals(file1, file2)
. Quand je l'essaye pour une petite quantité de fichiers (Dossier) ça marche mais pour ce dossier de données 150Gb, ça ne montre aucun résultat. Je pense d'abord stocker tous les fichiers dans un ArrayList fait le problème. JVM problème tas, je ne suis pas sûr.Vérification du contenu du fichier en double à l'aide de Java
Quelqu'un a de meilleurs conseils et un code d'échantillon pour gérer cette quantité de données? Aidez-moi, s'il vous plaît.
Avez-vous essayé de calculer la somme de contrôle du fichier au lieu de les lire? – Prashant
J'ai utilisé directement la méthode FileUtils.contentEquals pour vérifier les fichiers à chercher et stocker le résultat. – Mostafizur
@Prashant pourriez-vous s'il vous plaît écrivez-moi un exemple de code pour cela? – Mostafizur