2009-05-22 9 views
4

J'essaie de créer un logiciel qui automatise le PC en capturant la capture d'écran, puis OCR (Optical Character Recognition) à la recherche d'un bouton particulier à cliquer (pour Exemple). J'ai le contrôle de la souris et du clavier, mais maintenant, j'avais besoin d'un OCR pour traiter la capture d'écran. Ce que j'ai découvert, c'est que Tesseract OCR ne semble pas très bien fonctionner avec du texte à l'écran. Le texte est soit trop petit, soit qu'une partie du texte semble être connectée, comme par exemple K et X. Comment dois-je m'y prendre?OCR (Reconnaissance optique de caractères) pour le texte à l'écran

p/s: ceci est pour un programme de test automatisé.

+0

Pourriez-vous augmenter la taille du texte et modifier la police sur la machine de test? –

+0

Que voulez-vous tester exactement? Si c'est un programme de test simple, vous pouvez interroger Windows en utilisant SendMessage et GetWndText pour rechercher les boutons et les contrôles que vous aimez. Pourquoi aller à la rencontre d'un OCR? –

+0

Je peux augmenter la taille du texte, mais une partie de la police dans l'application ne peut pas être augmentée sans modifier le code. –

Répondre

0

Peut-être regarder this question sur l'amélioration de l'image avant l'OCR. Sinon, cette question est assez similaire à "OCR for .NET".

Si vous vous sentez vraiment audacieux, vous pouvez toujours concocter une approche simple basée sur le réseau Perceptron ou Neural :-)

0

Je ne sais pas si cela correspond vraiment à ce projet de loi pour vous, mais certains des meilleurs OCR J'ai vu dans l'automatisation est faite par Tevron CitraTest. Il a une bibliothèque de polices incluses et si un jeu de polices n'est pas présent, ils en créeront un nouveau en fonction de vos soumissions. Les facteurs natifs de cet outil seraient le coût et les problèmes habituels liés à la résolution d'écran variable.

Questions connexes