1

J'ai deux caméras étalonnées qui examinent une scène qui se chevauche. J'essaie d'estimer la pose de camera2 par rapport à camera1 (parce que camera2 peut bouger, mais camera1 et 2 auront toujours des fonctionnalités qui se chevauchent).Estimation de la traduction du monde réel entre deux caméras grâce à la correspondance de caractéristiques

J'identifie des caractéristiques en utilisant SIFT, en calculant la matrice fondamentale et éventuellement la matrice essentielle. Une fois que je résous pour R et t (l'une des quatre solutions possibles), j'obtiens la traduction à l'échelle, mais est-il possible de calculer d'une façon ou d'une autre la traduction en unités du monde réel? Il n'y a pas d'objets de taille connue dans la scène; mais j'ai les données d'étalonnage pour les deux caméras. J'ai parcouru quelques informations sur Structure from Motion et l'estimation de pose stéréo, mais le concept d'échelle et la corrélation avec la traduction du monde réel me confond.

Merci!

Répondre

2

Ceci est le problème d'échelle classique avec la structure du mouvement.

La réponse courte est que vous devez avoir une autre source d'information pour résoudre l'échelle.

Ces informations peuvent être sur les points de la scène (par exemple), carte du terrain ou une lecture du capteur de la caméra mobile (IMU, GPS, etc.)

+0

Merci pour la réponse. J'ai effectivement un GPS et un IMU fournissant des informations provenant de la caméra mobile, mais la pose qui en découle est assez bruyante: l'idée était donc d'améliorer la précision de ceux-ci en utilisant l'appariement des caractéristiques. Je pourrais avoir une bonne estimation de la position du GPS à l'image 1, qui pourrait dériver dans les images suivantes. Y a-t-il un moyen que je peux utiliser une "estimation" de la distance pour obtenir une valeur beaucoup plus précise? – HighVoltage

+1

L'approche standard pour résoudre ce problème est l'utilisation de l'ajustement du faisceau. Cela vous donnera la translation et la rotation relatives des caméras par rapport à la première caméra. Vous pouvez utiliser les informations GPS pour résoudre l'échelle et corriger les traductions. – Photon