2017-04-06 1 views
1

Je me demandais s'il y avait un moyen d'imprimer le chemin html entier. J'essaie de vérifier du texte dans un fichier pdf xhtml pop-up et ne peut pas arriver à. Mon espoir est d'obtenir la source entière de la page et de vérifier que le texte est là. Cependant .page_source semble ne me donner que l'url et la description et je cherche à obtenir chaque ligne de code.Sélénium Python Get PageSource de XHTML

+0

Avez-vous testé la solution proposée? – aberna

Répondre

0

Une approche possible consiste à faire en sorte que le sélénium trouve l'étiquette de page de départ (html) et d'obtenir tout le code lié à la source.

driver = webdriver.Firefox() 
driver.get("http://stackoverflow.com/") 
driver.find_element_by_tag_name("html").get_attribute('outerHTML') 

Documentation

Exemple de sortie:

<html webdriver="true"><head> 

<title>Stack Overflow</title> 
    <link rel="shortcut icon" href="https://cdn.sstatic.net/Sites/stackoverflow/img/favicon.ico?v=4f32ecc8f43d"> 
    <link rel="apple-touch-icon image_src" href="https://cdn.sstatic.net/Sites/stackoverflow/img/apple-touch-icon.png?v=c78bd457575a"> 
    <link rel="search" type="application/opensearchdescription+xml" title="Stack Overflow" href="/opensearch.xml"> 
    <meta name="twitter:card" content="summary"> 
    <meta name="twitter:domain" content="stackoverflow.com"> 
    <meta property="og:type" content="website"> 
    <meta name="description" content="Stack Overflow is the largest online community for programmers to learn, share their knowledge, and advance their careers"> 

    <meta property="og:image" itemprop="image primaryImageOfPage" content="https://cdn.sstatic.net/Sites/stackoverflow/img/[email protected]?v=73d79a89bded"> 
    <meta name="twitter:title" property="og:title" itemprop="title name" content="Stack Overflow"> 
    <meta name="twitter:description" property="og:description" itemprop="description" content="Q&amp;A for professional and enthusiast programmers"> 
    <meta property="og:url" content="http://stackoverflow.com/"> 

......