2010-09-11 7 views
1

J'ai un fichier edb de 60 Go, et je veux diviser la base de données en courriels individuels. Je n'ai aucune information sur le domaine d'origine, donc je ne peux pas lancer un Server 2k8 vm et l'y rattacher. J'ai fait quelques progrès avec une approche naïve de dépouiller les données binaires (octets pas 0x09, 0x0a, 0x0d, et 0x20 à 0x7f) du fichier (est passé de 60 à 30 Go), puis diviser cela aux en-têtes SMTP évidents. Cette approche ne semble pas fonctionner car Exchange ne conserve pas l'intégralité de l'e-mail dans un bloc contigu, et il semble dupliquer une grande partie de l'e-mail (il s'agit probablement d'un artefact de traitement du fichier en entier plutôt que de quelque chose de plus pratique, comme laisser le système de fichiers être un système de fichiers, et simplement stocker les emails dans/var/mail ou autre).Echange sous Linux

Donc, la question est: quels outils et documents pour le format de fichier de base de données Exchange sont cachés dans le monde que Google ne peut pas ou ne veut pas me montrer?

+0

Vas-y, frère! –

Répondre

2

Regardez le travail de Joachim Metz. Il a inversé le format edb et a analysé la base de données d'échange dans une mesure limitée. Il est open source et il y a même de la documentation sur les tables et colonnes:

http://sourceforge.net/projects/libesedb/files/

Cependant, il ne fait pas plus que vous avez apparemment atteint. Il exporte toutes les tables de l'edb dans des fichiers séparés. Vous devrez utiliser la documentation fournie et composer vous-même les courriels à partir des bits et des octets exportés de la base de données. Gardez à l'esprit cependant que les informations sur les e-mails et les pièces jointes est plutôt dispersée et toutes les colonnes sont plutôt cryptiques dans leur nom. Vous devez faire de la recherche et vous-même de l'ingénierie inverse pour passer à travers cette jungle de données.

Depuis que le projet est open source, vous pouvez ajuster ou étendre le code et arriver à l'endroit où vous voulez obtenir "facilement".