2011-01-14 8 views
12

Je cherchais une bibliothèque OCR - de manière optimale ce serait open-source - que je pourrais utiliser sur certains fichiers PDF en arabe. Googling cela n'a pas abouti à quelque chose d'utile. Je me demandais si quelqu'un connaissait une bibliothèque de ROC connexe ou même une bibliothèque qui travaille sur des langues apparentées (le farsi et l'ourdou pourraient être pertinents) que le soutien en arabe pourrait être ajouté.Bibliothèque OCR open-source pour l'arabe

Toutes les suggestions générales sur la façon d'aborder cela seront appréciées.

+0

http://stackoverflow.com/questions/6003630/open-source-ocr-for-arabic http://stackoverflow.com/ questions/6825712/need-an-opensource-of-arabic-ocr-soit-in-java-or-in-dotnet –

Répondre

0

Je ne sais rien à propos de la qualité OCR arabe, mais certains googling intelligent trouvé Sakhr's Automatic Reader. C'est un logiciel commercial.

Désolé. C'est commercial et assez cher. L'arabe est probablement l'une des langues les plus difficiles au monde à faire de l'OCR - je suppose qu'il faut beaucoup de motiver quelqu'un pour le faire.

7

À partir de la version 3.01 de Tessaract-ocr il prend désormais en charge l'arabe

0

La langue arabe est sophistiqué en matière de ROC en raison de la nature de la langue et il n'y a pas de logiciel libre ou commercial qui peut obtenir 100% de précision.

Ceci est de mon expérience personnelle, mais vous pouvez essayer IRISREadIRIS pro 14.

+0

Veuillez reformater votre article pour ajouter de la grammaire, c'est très difficile à lire. J'ai commencé, mais d'autres travaux sont nécessaires. – Vality

Questions connexes