J'ai une liste de coordonnées de carte [lat, lon]. Je voudrais filtrer ceux qui, par quelque métrique, sont trop éloignés du reste du groupe principal, les valeurs aberrantes. A) Une approche simple serait d'obtenir la médiane pour lat, lon puis de filtrer tout ce qui est plus éloigné de cette médiane que ladite métrique (par exemple distance). Cela ne fonctionnerait que pour une distance absolue (par exemple 5 km). B) Une amélioration de cette approche pourrait consister à supposer que pas plus de x% des paires de coordonnées seraient des valeurs aberrantes (établissant essentiellement un seuil à cet endroit). Ensuite, je trierais le tableau de coordonnées et retirerais le premier x/2% et le dernier x/2%. Puis trouvez la distance maximum de ce groupe de marqueurs qui serait la distance du premier marqueur au dernier marqueur dans ce tableau. Enfin, appliquez A) avec la métrique pour la distance étant la distance que nous venons de calculer (pour que la métrique de distance ne soit pas fixe)Approche optimale pour filtrer les coordonnées de carte aberrantes
C'est simplement une approche que j'ai très brièvement proposée, donc s'il y a des inconvénients évidents s'il vous plaît faites le moi savoir. Dans un esprit de discussion plus ouvert, comment allez-vous résoudre ce problème? Merci pour votre contribution
Quel est le problème avec les approches que vous avez déjà suggérées? –
Bien que FWIW: https://en.wikipedia.org/wiki/Outlier#Detection –
Je ne sais pas ce que je ne sais pas. Peut-être qu'il y a une meilleure idée là-bas. Il suffit de vérifier:) –