J'utilise l'option "TEXT_DETECTION" de l'API Google Cloud Vision pour effectuer une reconnaissance optique de caractères.L'API OCR Google Cloud Vision renvoie des valeurs incorrectes pour la boîte/les sommets de délimitation
La zone de délimitation autour des caractères individuels est parfois précise et parfois non, souvent dans la même image.
Est-ce un effet secondaire normal d'une nature probabiliste de l'algorithme de vision, un bug dans l'API Vision, ou bien sûr un problème avec la façon dont j'interprète la réponse?
est ici la partie de la réponse spécifique à la lettre « a » à partir de laquelle j'extraire la boîte de sélection.
stdClass Object
(
[property] => stdClass Object
(
[detectedLanguages] => Array
(
[0] => stdClass Object
(
[languageCode] => en
)
)
)
[boundingBox] => stdClass Object
(
[vertices] => Array
(
[0] => stdClass Object
(
[x] => 419
[y] => 304
)
[1] => stdClass Object
(
[x] => 479
[y] => 304
)
[2] => stdClass Object
(
[x] => 479
[y] => 397
)
[3] => stdClass Object
(
[x] => 419
[y] => 397
)
)
)
[text] => a
)
Tim. merci pour votre réponse et le lien, qui devrait être utile. Cependant, ma question portait sur les limites entourant les lettres, et non sur les taux de détection ou la précision. –