2017-01-02 4 views
1

J'utilise Tess-deux à OCR documents.It semble que l'équipe de Tesseract a fait un excellent travail et les résultats sont très bons !!
Mais maintenant je ne veux utiliser que des mots de mon fichier user_data.
Ici https://github.com/tesseract-ocr/tesseract/blob/master/doc/tesseract.1.asc#config-files-and-augmenting-with-user-data est un très bon exemple. J'ai trouvé tous les fichiers dans mon projet android que le lien de Tesseract suggère mais je ne peux pas faire en sorte que le programme utilise les mots du fichier user_data. J'ai trouvé le fichier .bazaar dans le dossier configs mais comment je l'ai mis dans mon code ??
Y a-t-il quelque chose qui me manque?Comment augmenter la sortie OCR de tesstwo en utilisant les données utilisateur dans ANDROID?

ci-dessous la partie du code que j'initialiser le tessbaseApi et configurer les commandes.

TessBaseAPI baseApi = new TessBaseAPI(); 
    baseApi.setDebug(true); 

    baseApi.init(Environment.getExternalStorageDirectory() + "/EMB/dataBase/", "eng"); 

    baseApi.setPageSegMode(TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED); 
    baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO_OSD); 
    baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE); 


    baseApi.ReadConfigFile("/path/to/configs/bazaar");  

    baseApi.setImage(myBitmap); 
    //variable for recognizing 

    String recognizedText = baseApi.getUTF8Text(); 
    /*recognizedText = recognizedText.replaceAll(blackList, "");//remove space*/ 
    String resultTxt = recognizedText; 
    // 
    baseApi.end(); 
    ocrreadytext.setText(resultTxt); 

Merci d'avance!

+0

I utilisé baseApi.ReadConfigFile (Environment.getExternalStorageDirectory() + "/ EMB/database/tessdata /" + "bazaar.txt"); Maintenant, l'application voit le fichier de configuration, mais rien ne se passe. Si je mets une commande inconnue dans le fichier bazaar alors l'application se bloque .... Une étape à la fois – Farmaker

Répondre