2010-10-11 10 views
1

Je me demande s'il existe un moyen de convertir une image numérisée avec du texte en texte lisible en y écrivant du code? Est-ce possible?Image numérisée au texte lisible

+1

Google OCR ..... –

+0

Java? PHP? Laquelle? Tous les deux? ... J'aime [OCRopus] (http://code.google.com/p/ocropus/) parce que c'est fait par le goog! –

+0

@Tony et @matt que je veux écrire en personnalisé à mettre en œuvre pour mon projet. – AAA

Répondre

4

OCRTools est ce que j'utilise pour .net

Pour Java, je l'ai utilisé Aspire dans le passé, il est très bon, un peu effrayant bien. J'ai entendu beaucoup de choses sur tesseract, vous pourriez aussi bien vérifier cela.

Si vous êtes confus par la réponse: Ce que vous cherchez est un API/SDK logiciel optique de reconnaissance de caractères. Ce que vous avez demandé dans la question est de construire un OCR à partir de zéro. Cela nécessite de comprendre le traitement d'image (principalement la reconnaissance d'objet).

+0

Curieux de savoir ce qui est un peu effrayant à propos de Aspire. Êtes-vous capable de partager? –

+0

En fait, j'ai eu des images Tiff à partir d'un balayage par lots. Les lire eux-mêmes était très confus, je devais les convertir en utilisant une autre bibliothèque (ImageMagick ou quelque chose) et ensuite, par coup et essai, convertir de petites parties de l'image et enlever le bruit et tout .... Mais c'était la version 1.quelque chose, maintenant c'est la version 4 ... – lalli