2017-04-23 3 views
0

J'ai trouvé sur https://fsix.github.io/mnist/Deskewing.html comment redresser les images de l'ensemble de données MNIST. Cela semble fonctionner. Mon problème est qu'avant de redresser chaque pixel a une valeur entre 0 et 1. Mais après avoir redressé l'image les valeurs ne sont plus entre 0 et 1. Ils peuvent être négatifs et peuvent être supérieurs à 1. Comment cela peut-il être réparé?Deskew images MNIST

Voici le code:

def moments(image): 
    c0,c1 = np.mgrid[:image.shape[0],:image.shape[1]] # A trick in numPy to create a mesh grid 
    totalImage = np.sum(image) #sum of pixels 
    m0 = np.sum(c0*image)/totalImage #mu_x 
    m1 = np.sum(c1*image)/totalImage #mu_y 
    m00 = np.sum((c0-m0)**2*image)/totalImage #var(x) 
    m11 = np.sum((c1-m1)**2*image)/totalImage #var(y) 
    m01 = np.sum((c0-m0)*(c1-m1)*image)/totalImage #covariance(x,y) 
    mu_vector = np.array([m0,m1]) # Notice that these are \mu_x, \mu_y respectively 
    covariance_matrix = np.array([[m00,m01],[m01,m11]]) # Do you see a similarity between the covariance matrix 
    return mu_vector, covariance_matrix 

def deskew(image): 
    c,v = moments(image) 
    alpha = v[0,1]/v[0,0] 
    affine = np.array([[1,0],[alpha,1]]) 
    ocenter = np.array(image.shape)/2.0 
    offset = c-np.dot(affine,ocenter) 
    return interpolation.affine_transform(image,affine,offset=offset) 

Répondre

1

Vous pouvez simplement normaliser l'image à une fourchette comprise entre 0 et 1 après le processus désalignement.

img = deskew(img) 
img = (img - img.min())/(img.max() - img.min()) 

Voir this question.

Pour incorporer cela dans la fonction deskew, vous pouvez réécrire comme ceci:

def deskew(image): 
    c,v = moments(image) 
    alpha = v[0,1]/v[0,0] 
    affine = np.array([[1,0],[alpha,1]]) 
    ocenter = np.array(image.shape)/2.0 
    offset = c-np.dot(affine,ocenter) 
    img = interpolation.affine_transform(image,affine,offset=offset) 
    return (img - img.min())/(img.max() - img.min())