J'utilise outils MAPI (Son lib Microsoft et .NET), puis apache TIKA bibliothèques pour traiter et extraire le pst du serveur d'échange, n'est pas évolutif.comment traiter/extrait .pst usig Hadoop Carte réduire
Comment puis-je traiter/extraire pst en utilisant MR way ... Y at-il un outil, bibliothèque disponible en java que je peux utiliser dans mes travaux MR. Toute aide serait complète.
Jpst Lib utilise en interne: PstFile pstFile = new PstFile(java.io.File)
Et le problème est pour Hadoop API « s nous n'avons rien près de java.io.File
.
option suivante est toujours là, mais pas efficace:
File tempFile = File.createTempFile("myfile", ".tmp");
fs.moveToLocalFile(new Path (<HDFS pst path>) , new Path(tempFile.getAbsolutePath()));
PstFile pstFile = new PstFile(tempFile);
probablement pas ... –
Pour ce faire d'une manière Map/Reduce, vous devez être en mesure de diviser le PST fichier en petits morceaux, de sorte que les nœuds individuels peuvent traiter leur partie. Je ne suis pas sûr que le format de fichier PST le supporte bien? – Gagravarr