J'ai reçu une affectation de vocabulaire en anglais par mon professeur.Travailler avec d'énormes fichiers texte en Java
Choisissez un alphabet aléatoire, dire 'a' Ecrire un mot de l'alphabet, disons 'pomme' Prenez le dernier mot 'e' Ecrire un mot de e, dire éléphant Maintenant de 't' et ainsi de suite .. Aucune répétition autorisée
Faites une liste de 500 mots. Envoyez la liste à l'enseignant. :)
Donc, au lieu de le faire moi-même, je travaille sur un code Java qui fera mes devoirs pour moi. Le code semble être simple.
Le cœur de l'algorithme: Récupère un mot aléatoire d'un dictionnaire, ce qui satisfait aux exigences. seek() avec RandomAccessFile. Essayez de le mettre dans un ensemble avec la commande (peut-être LinkedHashSet)
Mais le problème est l'énorme taille du dictionnaire avec 300 000+ enteries. : | Les algorithmes aléatoires de force brute ne fonctionneront pas.
Quelle pourrait être la solution la meilleure, la plus rapide et la plus efficace?
**** MISE À JOUR: ** Maintenant que j'ai écrit le code et son fonctionnement. Comment puis-je le rendre efficace afin qu'il choisisse des mots communs? Tous les fichiers texte contenant une liste de mots communs autour de? **
FYI: 1 lakh = 100000 – miku
À peu près conscient de cela. Le fichier texte est de 4MB! –
4Mo est plutôt petit, non? – miku