2017-06-22 1 views
1

J'ai utilisé l'API Microsoft OCR et je reçois le texte des images, mais j'aimerais savoir si le texte est dans une couleur spécifique ou a une couleur de fond spécifique.Comment obtenir la couleur du texte?

Par exemple je l'image suivante et je voudrais savoir s'il y a du texte en rouge i.e. image

Je pensais que cette ligne:

string requestParameters = "language=unk&detectOrientation=true"; 

me aiderait à établir les paramètres I J'aimerais recevoir de l'image si je voulais connaître la couleur d'une ligne de mots. J'ai donc ajouté une fonctionnalité visuelle comme ceci:

string requestParameters = "visualFeatures=Color,language=unk&detectOrientation=true"; 

Mais cela n'a pas résolu le problème. En outre: Puis-je mélanger le lien uriBase de l'analyse d'image et celui de l'OCR?

+0

Inventer votre propre paramètre d'URL pour appeler un service tiers semble être une idée étrange. Lorsque vous consultez [la documentation] (https://southeastasia.dev.cognitive.microsoft.com/docs/services/56f91f2d778daf23d8ec6739/operations/56f91f2e778daf14a499e1fc), aucun paramètre d'URL n'est défini pour obtenir la couleur. D'autre part, [cet exemple] (https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/quickstarts/python) utilise un paramètre 'visualFeatures' avec' Color' . –

+1

Je pense que vous avez raison. Je pense à cette posibilité car l'URL est proposée par Microsoft. Lorsque vous analysez une image, vous pouvez obtenir des caractéristiques visuelles comme des catégories, descritions (tags) et couleurs, etc. J'ai donc simplement mélangé les paramètres de requête de l'analyse d'une image avec les paramètres de requête d'une reconnaissance optique de caractères. Je n'ai jamais remarqué que le uriBase était différent. Donc _Peux-je mélanger à la fois uriBase (celui de l'analyse d'image et celui de l'OCR)? _ –

Répondre

2

Il n'existe actuellement aucun moyen de récupérer les informations de couleur et les résultats d'OCR en un seul appel.

Vous pouvez utiliser les cadres de sélection renvoyés par OCR pour recadrer l'image d'origine, puis envoyer la recadrer au analyze endpoint avec visualFeatures = color pour obtenir les informations de couleur du texte détecté.

+0

Donc, je ne peux pas utiliser à la fois uriBase (de l'analyse d'image et OCR) en même temps? Je devrais construire une autre méthode pour l'analyse d'image exclusive droite? –

+0

Oui, les requêtes OCR vont à/ocr, alors que l'analyse va à/analyser. Vous devrez d'abord passer un appel à/ocr? Language = unk & detectOrientation = true puis un second appel à/analyser? VisualFeatures = couleur –

0

Selon documentation, les paramètres de la requête possibles de cette api sont: langue

, detectOrientation

et les métadonnées de retour a ces entités:

orientation

, langue, régions, lignes, mots, boundingBox, texte

Il sera possible de combiner l'algorithme OCR avec un autre des algorithmes de vision par ordinateur pour détecter les couleurs dominantes dans les régions de texte que l'OCR identifié.