2017-07-10 2 views
-2

J'ai une liste de coordonnées de carte [lat, lon]. Je voudrais filtrer ceux qui, par quelque métrique, sont trop éloignés du reste du groupe principal, les valeurs aberrantes. A) Une approche simple serait d'obtenir la médiane pour lat, lon puis de filtrer tout ce qui est plus éloigné de cette médiane que ladite métrique (par exemple distance). Cela ne fonctionnerait que pour une distance absolue (par exemple 5 km). B) Une amélioration de cette approche pourrait consister à supposer que pas plus de x% des paires de coordonnées seraient des valeurs aberrantes (établissant essentiellement un seuil à cet endroit). Ensuite, je trierais le tableau de coordonnées et retirerais le premier x/2% et le dernier x/2%. Puis trouvez la distance maximum de ce groupe de marqueurs qui serait la distance du premier marqueur au dernier marqueur dans ce tableau. Enfin, appliquez A) avec la métrique pour la distance étant la distance que nous venons de calculer (pour que la métrique de distance ne soit pas fixe)Approche optimale pour filtrer les coordonnées de carte aberrantes

C'est simplement une approche que j'ai très brièvement proposée, donc s'il y a des inconvénients évidents s'il vous plaît faites le moi savoir. Dans un esprit de discussion plus ouvert, comment allez-vous résoudre ce problème? Merci pour votre contribution

+1

Quel est le problème avec les approches que vous avez déjà suggérées? –

+1

Bien que FWIW: https://en.wikipedia.org/wiki/Outlier#Detection –

+0

Je ne sais pas ce que je ne sais pas. Peut-être qu'il y a une meilleure idée là-bas. Il suffit de vérifier:) –

Répondre

1

Travailler séparément sur les coordonnées n'est pas la meilleure approche car il n'est pas invariant de rotation.

Vous pouvez essayer par "pelage d'oignon", c'est-à-dire en construisant la coque convexe du nuage de points et en retirant les sommets de la coque, à plusieurs reprises. Lire l'article "Détection des aberrations par pelage d'oignon dans des ensembles de données 2D, Archit Harsh, John E. Ball & Pan Wei".

+0

Impressionnant, c'est ce que je cherchais. –