2010-06-25 4 views
3

Je travaille sur un flux de travail de flux Hadoop pour Amazon Elastic Map Reduce et il consiste à sérialiser certains objets binaires et à les diffuser dans Hadoop. Est-ce que Hadoop a une longueur de ligne maximale pour l'entrée en continu?Hadoop streaming longueur de ligne maximale

J'ai commencé à tester simplement avec des lignes de plus en plus grandes, mais j'ai pensé que je demanderais d'abord ici.

+0

Qu'est-ce que c'est «AMZN EMR»? A côté de cela, je ne suis pas au courant des limites de longueur de ligne. – wlk

+0

AMZN EMR == Amazon Elastic Map Réduire, un service Hadoop à la demande. Je vais éditer le post. Merci! –

Répondre

4

Il ne semble y avoir aucune limite imposée sur la longueur de ligne. Depuis que j'ai posé la question, j'ai écrit du code qui sérialise des objets binaires, les code en base64, puis les met dans un flux pour le traitement. En conséquence, certaines lignes sont assez longues. Hadoop mâche droit sans aucune plainte.

Questions connexes