2017-05-01 2 views
0

Ma condition de base est que j'ai le document texte qui est généré à partir de l'outil OCR et maintenant je veux identifier quel type de document est-ce. Passeport, permis de conduire, relevé bancaire, S.S.N./Aadhar, par programmation via Java. Tout pointeur/démarreur aiderait. Merciidentifier le type/type document

+0

Les demandes de recommandations sont hors sujet à SO. Cependant, vous pouvez consulter https://stats.stackexchange.com/ – Sentry

Répondre

0

Ce qui est nécessaire: l'analyse du contenu pour les mots-clés avec "recherche floue" ou "caractère sauvage" pour tenir compte des erreurs possibles de l'OCR. Ces documents sont difficiles et sont sûrs de contenir des erreurs OCR en raison de milieux, etc Recherche de plus d'un mot-clé pour la redondance et classificaiotn plus tolérant.

Comment: nombreuses sources en ligne. Je suggère de commencer par la recherche générique pour "l'analyse de texte".