j'ai un fichier .json contenant beaucoup d'articles, chaque article est formaté comme ceci:données du groupe par mois et l'année
{
"source": "....",
"title": ".......",
"original_time": "ora: 20:03, 06 dec 2006",
"datetime": "2006-12-06T20:03:00+00:00",
"views": 398,
"comments": 1,
"content": "..."
"id": "13",
}
Maintenant, je dois résumer le nombre de vues de tous les articles pour chaque mois et l'année et de tracer les résultats ... mais je ne sais pas comment faire cela parce que je suis nouveau python ... Voilà ce que je l'ai fait:
import json
#from pprint import pprint
import csv
import time
import datetime
views = []
time = []
art_timpul = 0
unimedia = 0
total_articles = 0
json_data=open('all.json')
data = json.load(json_data)
#pprint(data)
json_data.close()
for i in data:
if i["source"] == 'unimedia':
art_unimedia += 1
x = i["views"]
views.append(int(x))
y = i["original_time"]
time.append(y)
if i["source"] == 'timpul':
art_timpul += 1
total_articles += 1
myfile = open('output.csv', 'wb')
wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
wr.writerow(views)
print time
#print views
print "Articles from Unimedia", art_unimedia
print "Articles from Timpul", art_timpul
print "Total articles", total_articles
Edit: Je dois regrouper les données par mois et année, je dois résumer le nombre de vues des articles écrits dans ce mois et l'année ... et les exporter dans un fichier
Quel est exactement le problème? Extraire les données de json, analyser la chaîne de date, regrouper les données, ...? S'il vous plaît soyez plus précis. –
Je dois regrouper les données par mois et année, je dois résumer le nombre de vues des articles écrits dans ce mois et l'année ... et les exporter dans un fichier – PlugaruT
vous devriez regarder dans les pandas. c'est bon pour ce genre de chose, mais il y a une courbe d'apprentissage abrupte. – acushner