Je veux construire une application hadoop qui peut lire les mots d'un fichier et chercher dans un autre fichier.Hadoop rechercher des mots d'un fichier dans un autre fichier
Si le mot existe - il doit écrire dans un fichier de sortie Si le mot n'existe pas - il doit écrire dans un autre fichier de sortie
J'ai essayé quelques exemples dans Hadoop. J'ai deux questions
Deux fichiers sont d'environ 200 Mo chacun. La vérification de chaque mot dans un autre fichier peut entraîner une insuffisance de mémoire. Y a-t-il une autre façon de faire cela?
Comment écrire des données dans différents fichiers car la sortie de la phase de réduction de hadoop n'écrit que dans un seul fichier. Est-il possible d'avoir un filtre pour réduire la phase pour écrire des données dans différents fichiers de sortie?
Merci.
Salut, je dois implemet presque la même chose que vous faites, mais je Hadoop débutants et vraiment les dont parviennent à en faire :/S'il vous plaît s'il vous plaît pouvez-vous jeter un oeil à ma question et me donner quelques commentaires, je suis vraiment du mal et ne peux pas obtenir aucune aide:/ http://stackoverflow.com/questions/2986271/need-help-implementing-this-algorithm -with-map-hadoop-mapreduce – Julia