Ce n'est pas gratuit (ou même pas cher!) Mais Aspose.Words devrait pouvoir faire ceci. Leur téléchargement d'évaluation vous permettra de jouer avec de petits fichiers.
Les fichiers de destination doivent-ils également être Docs? Vous pouvez ouvrir les documents dans Office et les enregistrer au format HTML. Alors la séparation devient triviale. RTF est également une option viable, mais je ne peux pas recommander un bon parseur RTF au sommet de ma tête.
Modifier dire: je viens de me rappeler une autre solution possible: Jacob, mais vous aurez besoin d'une instance d'Office en cours d'exécution sur la même machine. Il est court pour Java COM Bridge et il vous permet de faire des appels aux bibliothèques COM dans Office pour manipuler les documents. Je suis sûr que ce n'est pas aussi effrayant que cela puisse paraître!