J'ai un fichier.txt (séparé par des tabulations) qui doit être changé en une image, ordonnant fondamentalement la lecture du fichier ligne par ligne et créant des colonnes uniques pour l'image finale. De plus, écrire "Na" ou valeur vide quand aucune information n'est fondée. Notez le "CS_" comme un motif après ":". Je pensais au fichier pandas, mais votre aide sera grandement appréciée. Une suggestion dans R pourrait également être appréciée.Création de données uniques lisant un fichier ligne par ligne
entrée:
Japan Cases:CS_1 People:CS_2 Life:CS_3
Australia People:CS_4 Transportation:CS_Ground
Spain Life:CS_5 Language:CS_Spanish
sortie:
Cases People Life Transportation Language
Japan CS_1 CS_2 CS_3 Na Na
Australia Na CS_4 Na CS_Ground Na
Spain Na Na CS_5 Na CS_Spanish
Qu'avez-vous essayé jusqu'à présent? – asongtoruin
Une façon serait de lire le fichier texte dans un dict imbriqué avec le pays comme clé externe: '{'Japan': {'Cases': 'CS_1', 'People': CS_2 ',' Life ':' CS_3 '},' Australia ': {...},' Spain ': {...}} ', puis passez en revue le dict pour obtenir tous les noms de colonnes. Ensuite, créez votre dataframe. – DaveL17
Bien sûr, j'utilise python parce que j'ai un énorme fichier de données, sinon votre solution sera loin. J'ai des milliers de lignes et plus de 10 colonnes différentes – gusa10