1

Je prépare une solution pour regrouper des documents à l'aide de l'API Google Vision. Je voudrais regrouper des documents par quelque chose comme un modèle de document.Fichiers similaires à l'API Google Vision

Si je numérise d'abord une facture d'une société et quelques jours après un scan d'autres factures de la même société, puis-je vérifier qu'elles sont identiques?

+0

Vous pouvez essayer une chose appelée "dhash" ou https://github.com/Nakilon/dhash-vips – Nakilon

Répondre

0

Ce n'est pas quelque chose qui peut être fait par défaut avec l'API Vision. Vous pouvez utiliser le visionapi pour détecter du texte en utilisant l'OCR et voir si cela fournit suffisamment d'informations pour effectuer le clustering.

Sinon, vous devrez créer une implémentation personnalisée. Vous pourriez former un réseau de neurones pour faire la classification, ou peut-être une solution plus simple de "dumber" selon la façon dont votre entrée est structurée.