Je cherche un moyen de déterminer les N caractères ASCII les plus "différents" ou "reconnaissables" ... Par exemple, si N = 10, quels seraient les N caractères les plus différents dans l'ensemble ASCII de 0x21 à 0x7E? Évidemment, le caractère "X" est très différent de "O" (la lettre), mais "O" (la lettre) est très similaire à "0" (zéro). En supposant qu'un sous-ensemble de caractères OCR restreint, tel que zéro et la lettre O seraient détectés comme l'un ou l'autre seulement, et que l'on n'ait pas à s'inquiéter de savoir si c'était un zéro ou une lettre O, quel serait le N différent? caractères que les moteurs OCR typiques (par exemple Tesseract) reconnaissent facilement à partir d'une image d'entrée de mauvaise qualité? Hypothèses. tels que "+" et "t" pourraient largement être confondus les uns avec les autres. peut être fait, et donc chaque caractère d'entrée, que ce soit "+" ou "t" ne correspondrait qu'à l'un ou l'autre.OCR - la plupart des caractères ASCII "différents" ou "reconnaissables"?
Merci, Ben
Je pense que le choix des caractères dépend de la méthode utilisée pour les reconnaître. Pourquoi veux-tu faire cela? – Amok
En fait, je pense que cela dépendrait plus de FONT qu'autre chose ... –
Il n'est également pas très utile de poser la question pour des lettres individuelles, car les erreurs OCR confondent souvent "d" avec "cl", "m" avec "rn", etc. – ShreevatsaR