Je veux analyser ce "<a href="javascript:8==99999?popDuelloDialog(2754288):popTeam(2386)">Gnistan</a>
" et extraire le texte.Comment analyser le texte à partir d'une balise d'ancrage?
J'ai essayé d'extraire beaucoup, mais je ne pouvais pas réussir.
Je ne sais pas comment construire une méthode avec ce format « javascript vient » :(numbers)
"qui ne sont pas répéter. Je besoin d'une telle méthode qui utilisera uniquement la partie répétition et va extraire du texte dans le corps.
Mon code est ici:
import sys
from PyQt4.QtGui import QApplication
from PyQt4.QtCore import QUrl
from PyQt4.QtWebKit import QWebPage
import bs4 as bs
import urllib.request
import re
from bs4 import BeautifulSoup
class Client(QWebPage):
def __init__(self, url):
self.app = QApplication(sys.argv)
QWebPage.__init__(self)
self.loadFinished.connect(self.on_page_load)
self.mainFrame().load(QUrl(url))
self.app.exec_()
def on_page_load(self):
self.app.quit()
url = 'http://www.mackolik.com/Genis-Iddaa-Programi'
client_response = Client(url)
source = client_response.mainFrame().toHtml()
soup = bs.BeautifulSoup(source, 'html.parser')
#pattern=re.compile(r"javascript:;")
#js_test = soup.find_all('a', href='javascript')
hreff=soup.find_all("a","javascript:;")
#js_test=soup.select('a[href^="javascript:\('(.*?)'\);"]')
#print(js_test.text)
#type(href)
for i in hreff:
print(hreff[i])
Vous voulez juste analyser « Gnistan »? –
Ouais. Tout d'abord je veux analyser "Gnistan", sur la même page il y a beaucoup de textes que je veux analyser, alors bien sûr je vais appliquer la même méthode pour les autres. –
@TylerH, vous avez changé et généralisé le nom du sujet qui ne rend pas plus facile à atteindre et à trouver ce genre de question. Je crois qu'il y a beaucoup de gens qui recherchent la même chose mais ne comprennent jamais à partir des termes généralisés tels que l'étiquette d'ancrage. Il est plus facile de faire une recherche sur google "