Je viens de commencer à apprendre openrefine il y a 20 minutes. J'ai un fichier texte avec des données qui sont séparées par un en-tête cohérent ("JP") au début de chaque morceau de données. Les morceaux de données ne sont pas tous le même nombre de lignes. Je veux que chaque morceau des données d'origine soit sur 1 ligne dans openrefine. Comment puis je faire ça?Créer des colonnes à partir d'un fichier séparé par une ligne
Éditer: Voici un exemple. Il est un fichier assez désordonné, mais je peux compter sur le JP au début de chaque entrée distincte ..
JP
0034
1-25-60
01
checked 1/92
I am so happy to have taken these. The brown envelopes, blah blah. roll 1: Is a retirement event [EW]
JP
0035
2-1-60
01
checked 1/92
Bill therapy
JP
0036
2-11-60
01
Checked 1/92
Bill: there are many
EW: The bills look good.
I remember Babies used to look like this everyday, with the staff coming and going, all nice and professional.
JP
0037
2-11-60
01
checked 1/92
BLAHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHHH. blah blah blah blah bal…
oops>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
again
JP
0039
2-11-60
01
checked 1/92
JP
0041
3-14-60
votre question serait beaucoup plus clair avec un exemple – pintoch
+1 à pintoch - Pouvez-vous envoyer quelques exemples de données? Je ne suis pas clair si 'JP' est un séparateur entre les lignes ou entre les champs, et comment cela se rapporte à l'idée qu'il s'agit d'un 'fichier séparé par ligne' –
J'ai ajouté un échantillon dans la question initiale. C'est un fichier malpropre que j'ai besoin de traiter. Je veux juste une rangée pour toutes les lignes entre les "JP". Je veux une colonne pour chaque ligne. Certaines lignes auront plus de colonnes que d'autres. C'est correct dans ce contexte. –