Je suis intéressé par l'utilisation de l'OCR pour extraire des mots gras et italiques d'un texte simple. Par exemple, si je entrer une image claire avec le texte comme ceci: «Le rapide brun renard saute sur le paresseux chien »Puis-je utiliser l'OCR pour détecter le style de police (gras, italique)?
Je voudrais obtenir une sortie comme ceci: gras (« brun », « saute »), italique (« paresseux »)
Je l'ai regardé en faisant cela avec ocropus ou Tesseract, mais la documentation est pauvre et je ne peux pas dire si c'est possible, ou comment le faire si c'est le cas.
Nouvelle URL: https://github.com/tesseract-ocr/tesseract/blob/3.01/api/resultiterator.h#L95 –