2015-04-23 1 views
0

J'ai un ensemble de données composé de paris pour les matches de football. J'effectue une détection des valeurs aberrantes en utilisant 3 paramètres, les chances que l'équipe hôte gagne, les chances que le match se termine dans un match nul et les chances que l'équipe décisive gagne.Obtention de bruit dans DBSCAN en utilisant R

Chaque enregistrement ressemble à ceci:

Home Draw Away 
1.320 5.700 13.500 

J'ai identifié les groupes, mais je rencontre des difficultés à identifier lequel contient le bruit, semble être le dernier groupe le plus plausible (si je 10 groupes , le cluster 10 est le bruit.)

Est-ce la façon correcte d'obtenir des valeurs aberrantes à partir de mon ensemble de données en utilisant DBSCAN, y at-il un meilleur moyen?

De même, comment puis-je savoir combien de clusters j'ai pour obtenir le dernier (celui avec le bruit) sans vérification manuelle?

Je suis complètement nouveau à la programmation statistique et la détection des valeurs aberrantes, je m'excuse si je semble complètement désemparé.

Répondre

0

Lisez la documentation, s'il vous plaît.

entier appartenance à un groupe de codage vectoriel avec des observations de bruit (singletons) codé 0

Il est là, il suffit de chercher le mot « bruit » dans le manuel de dbscan.