Je veux utiliser le cache distribué pour permettre à mes cartographes d'accéder aux données. En principal, j'utilise la commandeaccès aux fichiers dans le cache distribué Hadoop
DistributedCache.addCacheFile(new URI("/user/peter/cacheFile/testCache1"), conf);
Où/user/Peter/cachefile/testCache1 est un fichier qui existe dans HDFS
Ensuite, ma fonction de configuration ressemble à ceci:
public void setup(Context context) throws IOException, InterruptedException{
Configuration conf = context.getConfiguration();
Path[] localFiles = DistributedCache.getLocalCacheFiles(conf);
//etc
}
Cependant, ce tableau LocalFiles est toujours nulle.
je courais d'abord sur un cluster hôte unique pour les tests, mais je lis que cela empêchera le cache distribué de travailler. J'ai essayé avec un pseudo-distribué, mais cela ne fonctionne pas non plus
J'utilise Hadoop 1.0.3
grâce Peter
double possible de [Fichiers pas correctement mis en cache distribué] (http://stackoverflow.com/questions/12708947/ fichiers-pas-mettre-correctement-dans-distribué-cache) – kabuko