2009-10-11 7 views
0

Si j'ai l'espace d'entrée de (1,2, .... 999). Et j'ai un concept de classe C, avec 10 concepts: C0, C1, C2 ... C9.Question sur la dimension VC

Pour une entrée, cette entrée est un élément de ci si elle contient le chiffre i. Par exemple, le nombre 123 est un élément de c1 et c2 et c3.

Qu'est-ce que le VC Dimension de ce concept de classe C?

+0

Ça me ressemble ... –

Répondre

2

Je ne veux pas poster la solution tout ici, mais voici quelque chose ...

Trouver la dimension VC implique de trouver des ensembles de points dans l'espace d'entrée qui peut être shattered par C.

Je peux facilement trouver un ensemble de trois points qui peuvent être brisés par C, (14, 24, 3).

Il est plus difficile de trouver un ensemble de quatre points qui peuvent être brisés par C, mais (157, 256, 367, 4) fonctionne.

Il est très, très difficile de trouver cinq points qui peuvent être brisés par C, ce qui suggère fortement que la dimension VC de C (étant donné l'espace d'entrée) est 4. Cependant, la partie difficile prouve qu'il est impossible de trouver un ensemble de cinq points qui peuvent être brisés.


En fait, il peut y avoir une certaine ambiguïté dans la question. Cela dépend du sens dans lequel la classe de concept peut classer correctement un ensemble de points. C'est-à-dire que C1 classe correctement (1, 2) où 1 reçoit une étiquette de classe négative et 2 reçoit une étiquette positive (puisqu'il la partitionne correctement), ou C2 peut-il faire cela? J'ai supposé que c'était possible, parce que le problème est un peu plus intéressant de cette façon.

+0

Pouvez-vous expliquer pourquoi '(157, 256, 367, 4)' fonctionne? Je vois quatre concepts différents - ce qui rendrait difficile l'utilisation d'une ligne droite pour les classer tous? (sauf s'ils sont disposés sur une ligne numérique ... sont-ils?) Pouvez-vous s'il vous plaît clarifier – CodyBugstein

0

Cette réponse est-elle vraiment correcte?

L'éclatement signifie que pour l'ensemble choisi de points de données, par ex. (14,24,3), pour chaque étiquetage possible de celui-ci, il existe un concept dans l'ensemble compatible avec cet étiquetage.

Mais considérez l'exemple (14,24,3) donné, voici une liste de tous les possibles étiquetages vrai/faux pour ces trois points, et quelles sont les classes compatibles avec eux

0 0 0 C_5, C_6, C_7, C_8, C_9, C_0 tous compatibles avec ce

0 0 1 C_3 uniquement (parce que le troisième nombre est trois, et seulement C_3 de classe contient)

0 1 0 C_2 et C_4 (parce que " 24 "contient 2 et 4)

0 1 1 C_2, C_4 et C_3

1 0 0 C_1 et C_4

1 0 1 pas de classes cohérentes (parce que "14" et "3" dont partager tous les chiffres en commun)

1 1 0 C_4 (parce que "14" et "24" contiennent tous les deux un 4)

1 1 1 pas de classes cohérentes

Ainsi, l'ensemble de la classe ne se brise pas cet ensemble de données. (Ou suis-je mal compris quelque chose dans la définition?