J'essaie de traiter cette image de tableau que j'ai enregistrée avec tesseract, mais je n'ai pas de chance J'ai pensé à faire un pré-traitement pour améliorer nos résultats mais je ne suis pas sûr des méthodes à utiliser . ilTesseract & OpenCV - Traitement Image
Voici l'image que j'ai:
Et voici les commandes tesseract
Je suis en cours d'exécution:
convert 468.jpg -bordercolor black -border 20x20 468-b.jpg
tesseract 468-b.jpg - -psm 11
S'il vous plaît noter qu'il n'a pas à traiter tous les symboles mathématiques correctement, mais au moins obtenir le 1 + 4 = 5
et peut-être le 2 x 12 = 24 x 1
.
J'avais une photo précédente qui a bien fonctionné en utilisant seulement ces commandes. Voici la photo:
Et voici les résultats, il crachait:
I+I
2+2m
Ce n'est pas parfait, mais il était bien mieux que ce que je recevais avant. Comment puis-je améliorer les résultats de ma nouvelle image de tableau? Ai-je besoin d'utiliser OpenCV, et le cas échéant, un exemple d'implémentation serait très, très utile
Merci à l'avance
post-scriptum C'était ma première question, j'ai demandé sur Tesseracts GitHub qui me conduire à de meilleurs résultats:
https://github.com/tesseract-ocr/tesseract/issues/468
aussi [ce] (http://www.juergenwiki.de/notes/machine_learning_reading_in_mnist_dataset.html) peut-être utile – sturkmen