2017-10-14 3 views
0

enter image description herehow to convert these datasets into valid datasets ,to do further case studyComment convertir des ensembles de données brutes en Normaliser jeu de données

J'ai copié ces ensembles de données et maintenant je veux faire de ces ensembles de données sous forme Standardiser, je suis un respect esprit débutant à la science des données, alors comment je peux faire plus loin en utilisant le code de python

is_mobile, n_products_viewed, visit_duration, is_returning_visitor, TIME_OF_DAY, user_action 1,0,0.657509946,0,3,0 1,1,0.568571234,0,2,1 1,0, 0,042245997,1,1,0 1,1,1,659793381,1,1,2 0,1,2.014744849,1,1,2 1,1,0.512447387,1,1,2 0,0,1,440327098,1,1,0 1,0,0.035260233,0,3,0 0,1,1.490764094,0,0,1 0 , 0,0.005837521,1,3,0 0,4,2.04604049,1,0,3 0,0,0.955889466,0,3,0

+0

ce serait mieux si vous avez posté votre jeu de données RAW et jeu de données attendu ... sous forme de texte – RomanPerekhrest

+0

est-ce que sir.n attendu est dans une rangée et colonne sage il devrait être mis – user8747401

+0

également poster le * formulaire standardize * – RomanPerekhrest

Répondre

0

Je suppose que vous cherchez à ranger vos données. ci-dessous sont la concession générale avec la définition de données ordonnées.

Each variable you measure should be in one column. 
Each different observation of that variable should be in a different row. 
There should be one table for each "kind" of variable. 
If you have multiple tables, they should include a column in the table that allows them to be linked. 

https://en.wikipedia.org/wiki/Tidy_data

Je donot voir toute question d'avoir la virgule comme séparateur. Les pandas peuvent charger csv avec pandas.read_csv().

Si vous souhaitez effectuer un effacement et un réarrangement des données, vous pouvez utiliser les méthodes pivot_table et fonte de la bibliothèque pandas.