Je travaille sur l'extraction de texte en images.Extraction de texte à partir d'images
Dans un premier temps les images sont colorées avec du texte placé en blanc, sur plus de traiter les images, le texte est affiché en pixels noirs et d'autres sont blancs (avec un peu de bruit), voici un échantillon:
Maintenant, quand j'essaie l'OCR en utilisant pytesseract (tesseract), je n'ai toujours pas de texte.
Est-il possible d'extraire du texte à partir d'images colorées?
Convertissez la couleur en niveaux de gris et définissez un seuil binaire pour que tout soit noir ou blanc. Vous pouvez essayer un despeckle ou autre pour supprimer le bruit, mais si 'tesseract' de la ligne de commande ne peut pas le ramasser alors je recommanderais' ocropy' de Google. –
Avez-vous essayé d'obtenir de l'aide sur le blog de [Adrian Rosebrock] (http://www.pyimagesearch.com/2017/07/10/using-tesseract-ocr-python/)? –
En principe, cela devrait être possible: Votre image fonctionne très bien avec Google OCR et à moitié ok avec ocr.space. J'ai testé avec https://ocr.space/compare-ocr-software –