2010-09-18 14 views
2

J'aimerais pouvoir mettre en surbrillance un mot dans une image d'un document lorsque l'utilisateur recherche ce mot. Exactement comme Google Books fait here. Pour autant que je sache, Tesseract et d'autres programmes OCR open source ne supportent pas ce type de fonction, alors quelqu'un a-t-il des idées sur la façon de le faire?Comment mettre en surbrillance un mot dans une image?

Répondre

2

Oui, ils "le supportent". Sorte de.

Ils vous donnent un rectangle qui vous indique où le mot est. En utilisant cela, remplissez ce rectangle avec la couleur de votre choix sur l'image en utilisant un color blending mode (par exemple, gardez la luma intacte et modifiez simplement la chrominance). Cela fonctionne bien avec les images en noir et blanc et en niveaux de gris, qui sont la plupart des livres, et est suffisant pour les polices les plus colorées aussi (sauf celles dans un arrière-plan coloré). Une solution à cela est d'inverser les couleurs au lieu de les mettre en surbrillance, ceci est fait dans beaucoup d'applications (Foxit Reader vient à l'esprit).

+0

Merci. Peut-être que je ne connais pas assez Tesseract. Je pensais juste qu'il a sorti un fichier texte. Où puis-je trouver ces rectangles? – Judson

+0

Voir ici: http://www.pixel-technology.com/freeware/tessnet2/ c'est un wrapper C# open-source. –

Questions connexes