Je dois implémenter une source d'entrée personnalisée (service) pour une application Hadoop MapReduce. Je google'd et SO'd et a constaté qu'une manière de procéder est d'implémenter un InputFormat personnalisé. Est-ce exact?Hadoop MapReduce InputFormat obsolète?
Apparemment selon http://hadoop.apache.org/common/docs/r0.20.2/api/org/apache/hadoop/mapred/InputFormat.html Les méthodes d'InputFormat getRecordReader() et getSplits() sont obsolètes. Quel est le remplacement?
l'exemple WordCount de Hadoop utilise toujours la même ...
Votre problème est réellement entre les versions. Une grande partie du problème avec '0.20.2' (la dernière version stable) est qu'il déprécie explicitement la fonctionnalité sans remplacement intra-version. Tel est le cas avec 'MultipleOutputs' et presque la totalité de' org.apache.hadoop.mapred'. Cela semble indiquer une restructuration majeure de l'API, que j'ai suivie. (Réponse à venir, une fois que je compile suffisamment d'informations sur la source.) – MrGomez