2010-03-31 8 views
1

Est-ce que quelqu'un connaît une bibliothèque OCR capable de gérer les photos en couleur (par opposition aux pages numérisées)?Bibliothèque OCR pour les photos, et non les images numérisées

Il me semble que la plupart des bibliothèques travaillent sur des images B et s'attendent à ce qu'elles proviennent d'un scanner. J'ai besoin de quelque chose qui puisse prendre une photo en couleur d'un panneau d'affichage, par exemple, et en extraire du texte.

Je suis actuellement envisage de convertir ces images à B & W tiff et de les nourrir à l'une des bibliothèques mentionnées dans this question, mais je suis sceptique ... Ces bibliothèques sont probablement conçu autour de l'hypothèse que les images sont numérisées documents ou pages de livres numérisées. J'ai besoin de quelque chose qui fonctionne sur le texte dans n'importe quelle orientation, de différentes tailles, d'alignements bizarres, etc., quelque chose qui peut extraire le plus de texte de ces images - il n'a pas besoin d'être précis à 100%.

Des idées?

+4

Regardez dans un HAL 9000 - Bon produit avec quelques mises en garde. ;-) –

+0

lol je l'ai effectivement googlé avant d'obtenir la référence :) –

+0

@Paul Sasik: malheureusement, il a une base très peu installée. Rappelez-vous également que l'unité avec ces mises en garde est prévue pour la récupération cette année. (et EOL après un mauvais coup de soleil) – Javier

Répondre

1

Vous pouvez utiliser un papier pour l'alignement. gocr pour OCR. Habituellement, un logiciel qui obtient une entrée de couleur le convertira en échelle de gris avant le traitement - c'est juste une étape de pré-traitement que les humains font ou le logiciel fait lui-même.

+2

Si les humains se convertissaient toujours en échelle de gris avant de reconnaître les modèles de caractères, personne ne réussirait un test de daltonisme. –

Questions connexes