2017-04-04 2 views
0

Lors de la conversion d'un fichier .docx dans un fichier PDF/A-1a avec LibreOffice, le fichier créé ne sont pas conformes à la norme PDF/A-1a.erronées cartographie Unicode lors de l'exportation au format PDF avec .docx LibreOffice

Lorsque je tente de valider le fichier à l'aide de contrôle en amont Adobe Acrobat l'erreur suivante montre ups:

Text cannot be mapped to unicode (154 matches on 2 pages) 

Et quand je copie le texte du PDF dans Preview.app tous les caractères accentués sont manquants ou gâcher.

De mes recherches, je comprends que LibreOffice ne construit pas la mise en correspondance /ToUnicode correctement pour les caractères accentués parce que ces personnages sont construits pour plus d'un glyphe et LibreOffice est juste affaire avec le premier glyphe. Ref: Can't copy text from PDF exported from OOo

Y a-t-il une solution de contournement? Comment puis-je convertir .docx en PDF/A valide par programmation sur Linux?

Pour info, voici la commande que j'utilise pour convertir le fichier:

unoconv -f pdf -eSelectPdfVersion=1 source-file.docx 

Cette autre commande ne donne pas un fichier PDF/A conforme comme prévu, mais il a le même problème de mappage Unicode:

libreoffice --headless --convert-to pdf source-file.docx 

Répondre

0

Le problème est présent avec LibreOffice 5.2.3.3 que j'utilisais. Le problème n'est pas présent avec LibreOffice 5.1.4.2 et 5.1.6.2. Donc, la rétrogradation en 5.1.6.2 corrige mon problème.

J'ai ajouté plus d'informations à un rapport de bogue existant.