Comment OCR un fichier tiff en utilisant l'interface de Tesseract dans C#?
Actuellement, je ne sais comment le faire en utilisant l'exécutable.OCR avec l'interface Tesseract
Répondre
Le code source semble être adapté à un exécutable, vous devrez peut-être recâbler un peu les données afin qu'elles soient construites en tant que DLL à la place. Je n'ai pas beaucoup d'expérience avec Visual C++ mais je pense que ça ne devrait pas être trop dur avec quelques recherches. Je suppose que quelqu'un aurait déjà fait une version de la bibliothèque, vous devriez essayer Google. Une fois que vous avez le code tesseract-ocr dans un fichier DLL, vous pouvez ensuite importer le fichier dans votre projet C# via Visual Studio et lui créer des classes wrapper et faire tous les trucs de marshaling pour vous. Si vous ne pouvez pas importer, alors DllImport vous permettra d'appeler les fonctions de la DLL à partir du code C#.
Ensuite, vous pouvez jeter un oeil à l'exécutable d'origine pour trouver des indices sur les fonctions à appeler pour OCR correctement une image tiff.
Jetez un oeil à tessnet
C'est mieux que P/L'invoquer soi-même. –
+1 - Fonctionne très bien et vous oubliez DllImports –
Disclaimer: Je travaille pour Atalasoft
Notre OCR module supports Tesseract et si cela se révèle ne pas être assez bon, vous pouvez passer à un meilleur moteur et il suffit de changer une ligne de code (nous fournissons une interface commune à plusieurs moteurs OCR).
Le programme C# lance tesseract.exe, puis lit le fichier de sortie de tesseract.exe.
Process process = Process.Start("tesseract.exe", "out");
process.WaitForExit();
if (process.ExitCode == 0)
{
string content = File.ReadAllText("out.txt");
}
J'ai découvert aujourd'hui que EMGU comprend maintenant une enveloppe Tesseract. Alors que le nombre de dlls non gérées de la bibliothèque opencv peut sembler un peu décourageant, il n'y a rien qu'une copie rapide dans votre répertoire de sortie ne guérira pas. De là, le processus OCR réel est aussi simple que trois lignes:
Tesseract ocr = new Tesseract(Path.Combine(Environment.CurrentDirectory, "tessdata"), "eng", Tesseract.OcrEngineMode.OEM_TESSERACT_ONLY);
this.ocr.Recognize(clip);
optOCR.Text = this.ocr.GetText();
« robomatics » mis ensemble a very nice youtube video qui démontre une solution simple mais efficace.
- 1. Compilation de tesseract-ocr sur ARM/Gumstix?
- 2. Comment puis-je installer et lancer tesseract-ocr en utilisant PHP
- 3. OCR (Reconnaissance optique de caractères) pour le texte à l'écran
- 4. code mobile exemple ocr
- 5. OCR - la plupart des caractères ASCII "différents" ou "reconnaissables"?
- 6. Comment donner les meilleures chances de succès à un logiciel OCR?
- 7. Bibliothèque Open Source Windows Mobile OCR
- 8. OCR pour reconnaître l'écriture manuscrite dans .NET
- 9. numérisation à haut volume et solution automatique OCR?
- 10. Écran grattant C application sans utiliser OCR ou DOM?
- 11. Comment intégrer un OCR externe dans un fichier PDF existant?
- 12. comment former un réseau en utilisant perceptron monocouche pour ocr?
- 13. paramètres de passage dans la réflexion C#
- 14. OCR: Comment trouver la bonne ColorMatrix pour définir de nouvelles couleurs?
- 15. OCR: Comment comparer les images, trier hors pair et le faire rapidement?
- 16. Appel via la ligne de commande par rapport à JNI
- 17. Comment puis-je obtenir un objet TIFF libtiff à partir d'un objet MagickWand (en C)?
- 18. Lire le pdf uploadstream une page à la fois avec java
- 19. Emplacement exact pour XSL-FO
- 20. C++ Débutant: Avoir toutes sortes de problèmes liant
- 21. Problèmes avec DataGridTemplateColumn avec ComboBox
- 22. Interaction avec programmation avec gdbserver
- 23. Utilise cette technique d'extraction de nom de fichier bash?
- 24. Reconnaissance de caractères dans l'image dans asp.net
- 25. UIPageControl avec UIView avec le bouton
- 26. en utilisant dotnetnuke (dnn) avec avec subversion
- 27. problème avec des entrées avec IE7
- 28. XSLT avec Xalan vs STX avec Joost
- 29. Subversion avec des groupes AD avec Linux?
- 30. WindowsError: instruction privilégiée lors de l'enregistrement d'une image FreeImagePy dans un script, fonctionne dans IDLE
pouvez-vous s'il vous plaît me guider comment vous avez réussi à utiliser Tesseract en C#? – mouthpiec
un exemple de code? – Kiquenet