date = '2017-08-04'
writer = pd.ExcelWriter('MLB Daily Data.xlsx')
url_4 = 'http://www.baseballpress.com/lineups/'+date
resp_4 = requests.get(url_4)
soup_4 = BeautifulSoup(resp_4.text, "lxml")
lineups = soup_4.findAll('div', attrs = {'class': 'players'},limit=None)
row_lineup = 0
for lineup in lineups:
lineup1 = lineup.prettify()
lineup2 = lineup1.replace('>'&&'<',',')
df4 = pd.DataFrame(eval(lineup2))
df4.to_excel(writer, sheet_name='Starting Lineups', startrow=row_lineups, startcol=0)
row_lineups = row_lineups + len(df.index) + 3
writer.save()
Je suis en train d'obtenir les files d'attente à partir de la page Web, le convertir eux dans une trame de données de pandas géants, puis enregistrez-le dans un fichier Excel. J'ai un problème avec le transformer en un cadre de données. J'ai remplacé les parenthèses par des virgules parce que j'ai pensé que cela le transformerait en format csv.Tirer contenu des balises div avec beautifulsoup et la création d'une trame de données de pandas géants
Ce fut ma meilleure estimation! –
Vous devez mettre plus d'effort votre contenu de div dans l'entrée de données appropriées (comme python dict, liste, etc) maintenant vous avez seulement une chaîne. essayer de déboguer \ sortie dans la console – SAZ