J'ai un ensemble de données composé de paris pour les matches de football. J'effectue une détection des valeurs aberrantes en utilisant 3 paramètres, les chances que l'équipe hôte gagne, les chances que le match se termine dans un match nul et les chances que l'équipe décisive gagne.Obtention de bruit dans DBSCAN en utilisant R
Chaque enregistrement ressemble à ceci:
Home Draw Away
1.320 5.700 13.500
J'ai identifié les groupes, mais je rencontre des difficultés à identifier lequel contient le bruit, semble être le dernier groupe le plus plausible (si je 10 groupes , le cluster 10 est le bruit.)
Est-ce la façon correcte d'obtenir des valeurs aberrantes à partir de mon ensemble de données en utilisant DBSCAN
, y at-il un meilleur moyen?
De même, comment puis-je savoir combien de clusters j'ai pour obtenir le dernier (celui avec le bruit) sans vérification manuelle?
Je suis complètement nouveau à la programmation statistique et la détection des valeurs aberrantes, je m'excuse si je semble complètement désemparé.