2017-10-12 2 views
-2

I ont deux matrices numpy de longueur identique (398 lignes), avec les 5 premières valeurs pour chacun de la manière suivante:Plot matrices de numpy incompatibles

y_predicted = 
[[-0.85908649] 
[-1.19176482] 
[-0.93658361] 
[-0.83557211] 
[-0.80681243]] 

y_norm = 
      mpg 
0  -0.705551 
1  -1.089379 
2  -0.705551 
3  -0.961437 
4  -0.833494 

Autrement dit, la première comporte des crochets autour de chaque valeur, et la seconde a une indexation et pas de crochets.

Les données sont une version normalisée de la première colonne (MPG) de l'ensemble de données Auto-MPG. Les valeurs y_predicted sont les résultats d'une régression linéaire.

https://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data

Est-ce que quelqu'un sait comment je pourrais convertir ces tableaux au même type que je puisse tracer un diagramme de dispersion d'entre eux?

Les deux ont la forme: (398, 1) Les deux ont le même type: classe 'numpy.ndarray', DTYPE float64


données à partir du lien fourni

18.0 8 307.0  130.0  3504.  12.0 70 1 "chevrolet chevelle malibu" 
15.0 8 350.0  165.0  3693.  11.5 70 1 "buick skylark 320" 
18.0 8 318.0  150.0  3436.  11.0 70 1 "plymouth satellite" 
16.0 8 304.0  150.0  3433.  12.0 70 1 "amc rebel sst" 
17.0 8 302.0  140.0  3449.  10.5 70 1 "ford torino" 
15.0 8 429.0  198.0  4341.  10.0 70 1 "ford galaxie 500" 
+0

La sortie que vous affichez est trop ambiguë pour indiquer ce qui se passe réellement dans vos données. Pouvez-vous donner plus d'informations, comme les types de tableaux, les formes et d'où ils viennent? –

+0

Quel est l'attribut 'dtype' des tableaux? –

+0

Est-ce exactement ce que vous voyez lorsque vous imprimez 'y_predicted [: 5]' et 'y_norm [: 5]'? Si le second tableau a une forme '(398, 1)', alors chacun de ceux-ci, '0 -0.705551', est un élément. Qu'est-ce que c'est, une chaîne? De plus, nous n'avons pas demandé 'type (y_predicted)', mais 'y_predicted.dtype'. – Reti43

Répondre

0

La seconde de ces ressemble à un pandasSeries pour moi. Si c'est le cas, vous pouvez faire y_norm.values pour obtenir le tableau sous-jacent numpy.