J'essaie d'obtenir des données d'evernote 'cahier partagé'. Par exemple, à partir de celui-ci: https://www.evernote.com/pub/missrspink/evernoteexamples#st=p&n=56b67555-158e-4d10-96e2-3b2c57ee372cpython parse evernote cahier partagé
J'ai essayé d'utiliser Beautiful Soup:
url = 'https://www.evernote.com/pub/missrspink/evernoteexamples#st=p&n=56b67555-158e-4d10-96e2-3b2c57ee372c'
r = requests.get(url)
bs = BeautifulSoup(r.text, 'html.parser')
bs
Le résultat ne contient pas d'informations de texte de l'ordinateur portable, seul un code.
J'ai également vu un conseil pour utiliser le sélénium et trouver des éléments par XPath. Par exemple, je veux trouver la tête de cette note - 'Term 3 Week2'. Dans Google Chrome, j'ai trouvé que c'est XPath est '/ html/body/div [1]/div [1]/b/span/u/b'. donc j'ai essayé ceci:
driver = webdriver.PhantomJS()
driver.get(url)
t = driver.find_element_by_xpath('/html/body/div[1]/div[1]/b/span/u/b')
Mais elle a aussi n'a pas fonctionné, le résultat était 'NoSuchElementException ...'. Je suis un novice en python et en particulier l'analyse, donc je serais heureux de recevoir de l'aide. J'utilise python 3.6.2 et jupiter-notebook.
Merci d'avance.
Pour ajouter à ce que @blakev dit, vous ne serez pas obtenir le code HTML correct, vous voulez des demandes parce que le "#" dans l'URL signifie que le bit après n'est pas envoyé au serveur, donc vous envoyez juste la réponse à 'https: // www.evernote.com/pub/missrspink/evernoteexamples' – AceLewis