2017-08-22 4 views
0

J'ai déballé la première image de l'ensemble d'entraînement MNIST et je peux accéder à la matrice (28,28).Quel format d'image sont les images MNIST?

enter image description here

[[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 3 18 18 18 126 136 
    175 26 166 255 247 127 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 30 36 94 154 170 253 253 253 253 253 
    225 172 253 242 195 64 0 0 0 0] 
[ 0 0 0 0 0 0 0 49 238 253 253 253 253 253 253 253 253 251 
    93 82 82 56 39 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 18 219 253 253 253 253 253 198 182 247 241 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 80 156 107 253 253 205 11 0 43 154 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 14 1 154 253 90 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 139 253 190 2 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 11 190 253 70 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 35 241 225 160 108 1 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 81 240 253 253 119 
    25 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 45 186 253 253 
    150 27 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 16 93 252 
    253 187 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 249 
    253 249 64 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 46 130 183 253 
    253 207 2 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 39 148 229 253 253 253 
    250 182 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 24 114 221 253 253 253 253 201 
    78 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 23 66 213 253 253 253 253 198 81 2 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 18 171 219 253 253 253 253 195 80 9 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 55 172 226 253 253 253 253 244 133 11 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 136 253 253 253 212 135 132 16 0 0 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0] 
[ 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 
    0 0 0 0 0 0 0 0 0 0]] 

Je veux faire un peu de traitement d'image sur comme la conversion en niveaux de gris et binarisation il (pour l'apprentissage de la machine), mais je suis confus quant à ce type de format d'image que je suis traiter avec. Si c'était un (28, 28, 3), il est évident que c'est une image RVB avec 3 canaux. Cependant, il s'agit d'une image (28, 28) avec chaque pixel prenant une valeur dans la plage discrète [0, 255], ce qui est plutôt étrange. Cette image est-elle déjà en échelle de gris et dois-je juste normaliser les valeurs de pixels? Qu'est-ce que la normalisation implique exactement? Est-ce que je multiplie le vecteur aplati par le scalaire 1/(sum of all energy values)?

Merci!

Répondre

1

Les images sont des images en niveaux de gris de 28x28 pixels avec une quantification de 8 bits (d'où la plage [0-255]). Les images étaient apparemment des images binaires noir/blanc, mais l'anti-aliasing lors du redimensionnement les a amenées à avoir des valeurs d'échelle de gris supplémentaires. Voir here pour plus de détails.

Normalement, vous devez normaliser en divisant toutes les valeurs par 255 (pas la somme de toutes les valeurs de pixels).