2009-02-26 8 views
3

Bonne nuit :)de base de comptage des pixels/cellulaire algorithme

Je joue actuellement avec la bibliothèque DevIL qui me permet de charger l'image et vérifier les valeurs RGB par pixel. Tout comme un projet d'apprentissage personnel, j'essaie d'écrire un système OCR très basique pour quelques images que j'ai faites moi-même dans Photoshop. Je suis capable de supprimer toutes les distorsions dans l'image et il me reste le texte et les nombres. Je ne recherche actuellement pas un réseau de neurones avancé qui apprend de l'entrée. Je veux commencer relativement facile et donc j'ai entrepris d'identifier les caractères individuels et de compter les pixels dans ces caractères.

J'ai deux problèmes:

  • Identification des caractères individuels. Plus important encore: J'ai besoin d'un algorithme pour compter les pixels connectés (de la même couleur) sans compter les pixels que j'ai comptés précédemment. Je n'ai pas d'antécédents mathématiques, c'est donc le plus gros problème pour moi.

Toute aide en la matière est appréciée, merci.

modifier:

J'ai marqué cette question comme C++ parce que c'est ce que je suis actuellement en utilisant. Cependant, le pseudo-code ou le code facilement lisible d'une autre langue est également bon.

Répondre

2

L'algorithme flood fill fonctionnera pour le comptage des pixels inclus, tant que les images sont filtrées sur de simples bitmaps blancs &. Cela dit, vous pouvez effectuer une reconnaissance de caractères en comparant chaque caractère à un ensemble d'images standard de chaque personnage de votre ensemble, en mesurant la similarité, puis en choisissant le personnage ayant le score le plus élevé. Pour plus d'informations, consultez this question pour plus d'informations.

+0

Cela semble intéressant, je vais jeter un oeil. Merci! –

+0

Pas de problème. Bonne chance! –

1

Vous n'êtes pas sûr que cela aide, mais il existe une bibliothèque GPL OCR appelée gocr.

1

Excuses si cela est trop hors-sujet, mais IMHO Vigra (pas l'autre!) Est une bien meilleure bibliothèque de traitement d'image pour C++ que DevIL.

+0

J'allais presque marquer cette réponse comme spam ;-) – LeopardSkinPillBoxHat

+0

Ouais, j'ai pensé qu'il était préférable de clarifier ... vous ne savez pas combien de fois j'ai vu ce lien dans mes signets :) –

+0

Pourquoi quelqu'un nommer leur produit comme ça? – Naveen