ne peut pas écrire le fichier csv avec python

J'essaie de convertir le fichier json en fichier csv. le fichier json est venu de tweepy.ne peut pas écrire le fichier csv avec python

import json 
import csv 

fo = open('Sclass.json', 'r') 
fw = open('Hasil_Tweets.csv', 'a') 

for line in fo: 
     try: 
       tweet = json.loads(line) 
       fw.write(tweet['id'],tweet['timestamp_ms'],tweet['user']['name'],tweet['user']['statuses_count'],tweet['user']['friends_count'],tweet['user']['followers_count'],tweet['place']['bounding_box']['coordinates'],tweet['text']+"\n") 
     except: 
       continue

mais lorsque je l'imprime, cela fonctionne. et quand j'écris juste fw.write(tweet['text']) cela fonctionne.

Merci

oh ya et je Noob ni sur python et tweepy. mais mon instinct dit, ce problème se rapporte au fichier json lui-même. Désolé pour mon anglais. c'est le fichier JSON elle-même:

{ 
    "created_at": "Wed Oct 11 08:36:21 +0000 2017", 
    "id": 918032510927355904, 
    "id_str": "918032510927355904", 
    "text": "@irfanzayo @puisisi @tasyak Lo tuh kebiasaan overthinking \ud83d\ude24", 
    "display_text_range": [ 
     28, 
     59 
    ], 
    "source": "<a href=\"http://twitter.com/download/android\" rel=\"nofollow\">Twitter for Android</a>", 
    "truncated": false, 
    "in_reply_to_status_id": 918032029094047746, 
    "in_reply_to_status_id_str": "918032029094047746", 
    "in_reply_to_user_id": 60049976, 
    "in_reply_to_user_id_str": "60049976", 
    "in_reply_to_screen_name": "irfanzayo", 
    "user": { 
     "id": 59980455, 
     "id_str": "59980455", 
     "name": "Mutiara Sisyanni D", 
     "screen_name": "MutiaraSisyanni", 
     "location": "Jakarta, Indonesia", 
     "url": "http://mutiarasyn.wixsite.com/mutiarasisyanni", 
     "description": null, 
     "translator_type": "none", 
     "protected": false, 
     "verified": false, 
     "followers_count": 354, 
     "friends_count": 237, 
     "listed_count": 1, 
     "favourites_count": 326, 
     "statuses_count": 6507, 
     "created_at": "Sat Jul 25 04:31:47 +0000 2009", 
     "utc_offset": 25200, 
     "time_zone": "Jakarta", 
     "geo_enabled": true, 
     "lang": "en", 
     "contributors_enabled": false, 
     "is_translator": false, 
     "profile_background_color": "FA8C9E", 
     "profile_background_image_url": "http://abs.twimg.com/images/themes/theme5/bg.gif", 
     "profile_background_image_url_https": "https://abs.twimg.com/images/themes/theme5/bg.gif", 
     "profile_background_tile": false, 
     "profile_link_color": "FF8A94", 
     "profile_sidebar_border_color": "FFFFFF", 
     "profile_sidebar_fill_color": "99CC33", 
     "profile_text_color": "3E4415", 
     "profile_use_background_image": false, 
     "profile_image_url": "http://pbs.twimg.com/profile_images/486497248293826560/FANdzhL9_normal.jpeg", 
     "profile_image_url_https": "https://pbs.twimg.com/profile_images/486497248293826560/FANdzhL9_normal.jpeg", 
     "profile_banner_url": "https://pbs.twimg.com/profile_banners/59980455/1404826066", 
     "default_profile": false, 
     "default_profile_image": false, 
     "following": null, 
     "follow_request_sent": null, 
     "notifications": null 
    }, 
    "geo": null, 
    "coordinates": null, 
    "place": { 
     "id": "66555622726ab358", 
     "url": "https://api.twitter.com/1.1/geo/id/66555622726ab358.json", 
     "place_type": "city", 
     "name": "Setia Budi", 
     "full_name": "Setia Budi, Indonesia", 
     "country_code": "ID", 
     "country": "Indonesia", 
     "bounding_box": { 
      "type": "Polygon", 
      "coordinates": [ 
       [ 
        [ 
         106.817351, 
         -6.24152 
        ], 
        [ 
         106.817351, 
         -6.201177 
        ], 
        [ 
         106.852353, 
         -6.201177 
        ], 
        [ 
         106.852353, 
         -6.24152 
        ] 
       ] 
      ] 
     }, 
     "attributes": {} 
    }, 
    "contributors": null, 
    "is_quote_status": false, 
    "quote_count": 0, 
    "reply_count": 0, 
    "retweet_count": 0, 
    "favorite_count": 0, 
    "entities": { 
     "hashtags": [], 
     "urls": [], 
     "user_mentions": [ 
      { 
       "screen_name": "irfanzayo", 
       "name": "irfan zayanto", 
       "id": 60049976, 
       "id_str": "60049976", 
       "indices": [ 
        0, 
        10 
       ] 
      }, 
      { 
       "screen_name": "puisisi", 
       "name": "Puisi Pancara", 
       "id": 32809069, 
       "id_str": "32809069", 
       "indices": [ 
        11, 
        19 
       ] 
      }, 
      { 
       "screen_name": "tasyak", 
       "name": "Tasya Kurnia", 
       "id": 41986880, 
       "id_str": "41986880", 
       "indices": [ 
        20, 
        27 
       ] 
      } 
     ], 
     "symbols": [] 
    }, 
    "favorited": false, 
    "retweeted": false, 
    "filter_level": "low", 
    "lang": "in", 
    "timestamp_ms": "1507710981481" 
}

une autre erreur

Traceback (most recent call last): File "C:\Users\User\Desktop\fase 1-20170930T062552Z-001\transformCSV.py", line 7, in tweet = json.loads(line) File "C:\Users\User\AppData\Local\Programs\Python\Python36-32\lib\json__init__.py", line 354, in loads return _default_decoder.decode(s) File "C:\Users\User\AppData\Local\Programs\Python\Python36-32\lib\json\decoder.py", line 339, in decode obj, end = self.raw_decode(s, idx=_w(s, 0).end()) File "C:\Users\User\AppData\Local\Programs\Python\Python36-32\lib\json\decoder.py", line 357, in raw_decode raise JSONDecodeError("Expecting value", s, err.value) from None json.decoder.JSONDecodeError: Expecting value: line 2 column 1 (char 1)

Traceback (most recent call last): 
    File "C:\Users\Tanabata\Desktop\Putang ina mo\spli.py", line 8, in <module> 
    tweet = json.load(fo) 
    File "C:\Users\Tanabata\AppData\Local\Programs\Python\Python36-32\lib\json\__init__.py", line 299, in load 
    parse_constant=parse_constant, object_pairs_hook=object_pairs_hook, **kw) 
    File "C:\Users\Tanabata\AppData\Local\Programs\Python\Python36-32\lib\json\__init__.py", line 354, in loads 
    return _default_decoder.decode(s) 
    File "C:\Users\Tanabata\AppData\Local\Programs\Python\Python36-32\lib\json\decoder.py", line 342, in decode 
    raise JSONDecodeError("Extra data", s, end) 
json.decoder.JSONDecodeError: Extra data: line 3 column 1 (char 2893)

fichier JSON itselft: http://www.mediafire.com/file/l3rzzbe0nbu1nlu/Sclass.json

Source

2017-10-15 Tanabata

Vous n'utilisez pas csv. Vous devez créer un writer:

import json 
import csv 

with open('Sclass.json', 'r') as fo, open('Hasil_Tweets.csv', 'a') as fw: 
    writer = csv.writer(fw) 
    for line in fo: 
     tweet = json.loads(line) 
     writer.writerow([tweet['id'],tweet['timestamp_ms'],tweet['user']['name'], 
      tweet['user']['statuses_count'],tweet['user']['friends_count'], 
      tweet['user']['followers_count'], 
      tweet['place']['bounding_box']['coordinates'],tweet['text']])

Pour votre deuxième question, il semble, vous ne disposez pas d'un JSON-lignes-fichier, mais un fichier avec un seul jeu de données JSON. Donc, la lecture ligne par ligne est mauvaise, vous devriez lire le fichier dans son ensemble:

with open('Sclass.json', 'r') as fo: 
    tweet = json.load(fo) 

with open('Hasil_Tweets.csv', 'a') as fw 
    writer = csv.writer(fw) 
    writer.writerow([tweet['id'],tweet['timestamp_ms'],tweet['user']['name'], 
     tweet['user']['statuses_count'],tweet['user']['friends_count'], 
     tweet['user']['followers_count'], 
     tweet['place']['bounding_box']['coordinates'],tweet['text']])

Source

2017-10-15 09:12:17 Daniel

merci monsieur, mais j'ai un autre erorr: AttributeError: l'objet '_csv.writer' n'a aucun attribut 'write' – Tanabata

Désolé, devrait être 'writerow'. Réponse corrigée. – Daniel

merci monsieur, mais un autre erorr: writerow() prend exactement un argument (8 donné) sry vous dérange monsieur. – Tanabata

Dès que vous travaillez avec des tables (csv étant l'un) pense Pandas (mon avis).

Dans ce cas, nous pouvons utiliser pandas json_normalize pour interpréter votre fichier json.

import json 
from pandas.io.json import json_normalize 

with open("Sclass.json.json") as f: 
    df = json_normalize(json.load(f)) 

cols = ["id","timestamp_ms","user.name", 
     "user.statuses_count","user.friends_count","user.followers_count", 
     "place.bounding_box.coordinates","text"] 

df[cols].to_csv("Hasil_Tweets.csv",sep=",",index=False) # outputs to csv

Pandas viennent avec de nombreuses options de sortie, l'un d'entre eux étant une table html. Je vais l'utiliser pour montrer l'outut:

print(df[cols].to_html(index=False)) # outputs to html to show result

Sortie

<table border="1" class="dataframe"> 
 
    <thead> 
 
    <tr style="text-align: right;"> 
 
     <th>id</th> 
 
     <th>timestamp_ms</th> 
 
     <th>user.name</th> 
 
     <th>user.statuses_count</th> 
 
     <th>user.friends_count</th> 
 
     <th>user.followers_count</th> 
 
     <th>place.bounding_box.coordinates</th> 
 
     <th>text</th> 
 
    </tr> 
 
    </thead> 
 
    <tbody> 
 
    <tr> 
 
     <td>918032510927355904</td> 
 
     <td>1507710981481</td> 
 
     <td>Mutiara Sisyanni D</td> 
 
     <td>6507</td> 
 
     <td>237</td> 
 
     <td>354</td> 
 
     <td>[[[106.817351, -6.24152], [106.817351, -6.2011...</td> 
 
     <td>@irfanzayo @puisisi @tasyak Lo tuh kebiasaan o...</td> 
 
    </tr> 
 
    </tbody> 
 
</table>

Source

2017-10-16 08:15:26

merci monsieur. mais je reçois un problème ici, 1.raise JSONDecodeError ("données supplémentaires", s, fin) 2.json.decoder.JSONDecodeError: Données supplémentaires: ligne 3 colonne 1 (char 2893) quoi de mal avec elle? lorsque vous avez réussi à extraire les données et je ne suis pas>. < – Tanabata

@Tanabata Hmm .. J'ai pris le texte que vous avez posté et créé un fichier json avec le même nom. Avez-vous plus de données éventuellement? J'utilise normalement jsonlint.com pour vérifier si quelque chose ne va pas. –

merci monsieur j'ai essayé de valider le json et le résultat est de nombreux tings pas juste et j'essaie un autre fichier json de = https://nocodewebscraping.com/twitter-json-examples/ witch a json fichier ainsi et ils donnent même erreur: raise JSONDecodeError ("Données supplémentaires", s, fin) json.decoder.JSONDecodeError: Données supplémentaires: ligne 89 colonne 2 (car 3438) le différent en ligne est ligne, colonne et graphique. ohh je poste mon fichier json sur la question ci-dessus. merci monsieur – Tanabata

J'ajoute cela comme une autre réponse. Le * .json que vous avez partagé est en fait un gros fichier contenant plusieurs chaînes json, mais seulement deux lignes. Comment avez-vous obtenu ce fichier depuis le début, je ne sais pas, mais vous pouvez le lire en utilisant ceci:

import json 
import pandas as pd 

with open("Sclass.json") as f: 
    data = [json.loads(row.strip()) for row in f.readlines()[0::2]]

Cependant, lors de la lecture de cette structure à un dataframe vous pouvez voir qu'il est vraiment pas une structure claire :

pd.DataFrame(data)

Conclusion: Votre problème est entièrement autre.

Source

2017-10-21 12:50:43

merci monsieur. donc le fichier JSON pas bien structuré monsieur? Eh bien, si cela ne vous dérange pas pouvez-vous corriger mon streamlistener afin que je puisse obtenir le bon fichier json ou fichier csv ceci est mon conde: def on_data (self, data): essayez: avec open ('tescsv.json', ' a ') comme f: f.write (données) retour Vrai sauf BaseException comme e: print ("erreur on_data:% s" % str (e)) retour Vrai def on_error (auto, statut) : print (status) return True – Tanabata

ne peut pas écrire le fichier csv avec python

Répondre

Questions connexes