Je me demandais s'il y avait un moyen d'imprimer le chemin html entier. J'essaie de vérifier du texte dans un fichier pdf xhtml pop-up et ne peut pas arriver à. Mon espoir est d'obtenir la source entière de la page et de vérifier que le texte est là. Cependant .page_source semble ne me donner que l'url et la description et je cherche à obtenir chaque ligne de code.Sélénium Python Get PageSource de XHTML
1
A
Répondre
0
Une approche possible consiste à faire en sorte que le sélénium trouve l'étiquette de page de départ (html) et d'obtenir tout le code lié à la source.
driver = webdriver.Firefox()
driver.get("http://stackoverflow.com/")
driver.find_element_by_tag_name("html").get_attribute('outerHTML')
Exemple de sortie:
<html webdriver="true"><head>
<title>Stack Overflow</title>
<link rel="shortcut icon" href="https://cdn.sstatic.net/Sites/stackoverflow/img/favicon.ico?v=4f32ecc8f43d">
<link rel="apple-touch-icon image_src" href="https://cdn.sstatic.net/Sites/stackoverflow/img/apple-touch-icon.png?v=c78bd457575a">
<link rel="search" type="application/opensearchdescription+xml" title="Stack Overflow" href="/opensearch.xml">
<meta name="twitter:card" content="summary">
<meta name="twitter:domain" content="stackoverflow.com">
<meta property="og:type" content="website">
<meta name="description" content="Stack Overflow is the largest online community for programmers to learn, share their knowledge, and advance their careers">
<meta property="og:image" itemprop="image primaryImageOfPage" content="https://cdn.sstatic.net/Sites/stackoverflow/img/[email protected]?v=73d79a89bded">
<meta name="twitter:title" property="og:title" itemprop="title name" content="Stack Overflow">
<meta name="twitter:description" property="og:description" itemprop="description" content="Q&A for professional and enthusiast programmers">
<meta property="og:url" content="http://stackoverflow.com/">
......
Avez-vous testé la solution proposée? – aberna