Je suis en train de jouer avec une idée, et je suis bloqué à cette partie. Je souhaite lire une page HTML externe, puis extraire les données contenues dans deux balises <dd>
. J'ai utilisé file_get_contents
avec de bons résultats, mais je ne sais pas comment accomplir cette dernière partie. Les deux étiquettes dont je veux extraire la valeur sont toujours entourées d'un <div>
particulier, se demandait si cela pourrait aider? Dans mon esprit, il lit le fichier html entier dans une chaîne, puis vide toutes les données jusqu'à ce que celui-ci en particulier <div>
et vide toutes les données après la fermeture </div>
. Est-ce possible? Je pense que cela nécessite une syntaxe regex que je n'ai jamais utilisée. Donc, des conseils, des liens ou des exemples seraient géniaux! Je peux fournir plus d'informations si nécessaire.Lire la page HTML externe, puis trouver des données dans
1
A
Répondre
0
Vous compliquez beaucoup trop. Il suffit de charger le contenu de la page, puis recherchez la regex appropriée (preg_match()
). Cela fera bien
preg_match('~<tag id="foobar">(?P<content>.*?)</endtag>~is', $input, $matches);
1
Peut-être que cela pourrait aider: http://simplehtmldom.sourceforge.net/
0
Si vous utilisez HTQL COM pour interroger la page, la requête est: <dd> 1: tx
Questions connexes
- 1. Page HTML externe, dans AJAX Iframe?
- 2. Comment lire le titre d'une page externe?
- 3. page dans une page HTML - page externe ne change pas la page intérieure peut être défilée
- 4. Get source HTML de la page Web externe
- 5. UI Onglet charger page externe dans la page externe (2 niveaux)
- 6. Lire la page Web
- 7. SimpleModal charger la page HTML externe dans la boîte de dialogue
- 8. HTML dans la base de données
- 9. Graphiques - trouver des données communes
- 10. import html externe en ligne html
- 11. chargement d'une fonction C++ externe à partir d'une page HTML
- 12. Jquery getJSON à la page PHP externe
- 13. macros Lire fichier externe rapidement
- 14. Comment puis-je trouver des éléments html qui contiennent du texte spécifique dans un commentaire html?
- 15. Comment envoyer des données de la page flash vers la page html?
- 16. Côté serveur inclure HTML externe?
- 17. Lire des données MIME en utilisant PHP
- 18. La page ASP a des données tronquées
- 19. Lire les données de la page client asp.net et C#
- 20. Où puis-je trouver des informations sur la classe Html dans ASP.net?
- 21. Lire un fichier audio et revenir à la page
- 22. Comment insérer des valeurs de champs de la page HTML dans la base de données SQLite
- 23. Javascript nécessaire pour trouver une boîte dans une page html puis le contenu
- 24. Comment puis-je lire des données à partir de PowerPoint
- 25. copie de la page html avec des données mysql dans php
- 26. Lire le tableau HTML dans R - Dépannage
- 27. Page HTML incorporée dans Flash Movie
- 28. Jquery ne répond pas à la page chargée externe
- 29. afficher des valeurs à la page externe explicitement PHP
- 30. Lire la valeur rendue dans la page avec JSF
Oui, vous pouvez utiliser RegEx pour analyser HTML, [ou pas] (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454) – hemp
Tout le monde sait que le HTML est langue non-régulière. Mais la question était en fait: j'ai un texte enveloppé avec des phrases statiques, comment puis-je le trouver? Dom est beaucoup plus lent (et en php est même pire que dans d'autres langues) que regex simple. –