2009-04-03 6 views
9

Je recherche des algorithmes, des documents ou des logiciels pour améliorer les télécopies, les images provenant d'appareils photo de téléphones cellulaires et d'autres sources similaires pour la lisibilité et l'OCR. Je m'intéresse principalement à des améliorations simples (par exemple choses que vous pourriez faire en utilisant ImageMagick), mais je suis également intéressé par des techniques plus sophistiquées. Je parle déjà à des vendeurs, donc pour cette question, je suis surtout à la recherche d'algorithmes ou de logiciels open source.Algorithmes de traitement/d'amélioration d'image pour l'OCR/la lisibilité des documents?

Pour clarifier davantage: je ne recherche pas de logiciel OCR ou d'algorithmes; Je suis à la recherche d'algorithmes pour nettoyer l'image afin qu'elle soit plus lisible à l'œil nu et puisse éventuellement être utilisée pour l'OCR.

Répondre

5

J'ai eu un problème similaire quand je en train d'écrire un logiciel pour faire numérisation de livres; flotter sur Internet est un programme appelé pagetools qui permet de redresser des pages numérisées en utilisant une astuce mathématique assez intelligente appelée la transformation Radon.

J'ai également écrit une petite routine qui effacerait l'espace vide sur la page; Les algorithmes OCR ont tendance à faire beaucoup mieux quand ils n'ont pas à faire face au bruit de fond. Ce que j'ai fait, c'était chercher des pixels de couleur claire qui étaient à plus d'un petit rayon par rapport aux pixels de couleur sombre, puis les amplifier jusqu'à devenir blanc pur.

Cela fait quelques années, donc je n'ai pas les détails d'implémentation exacte à portée de main.

4

Un filtre d'image simple à regarder est le "filtre médian" qui est un filtre très simple, facile à mettre en œuvre, pour aider à nettoyer le texte numérisé/photographié. http://en.wikipedia.org/wiki/Median_filter

Questions connexes