2010-04-25 5 views
5

Je voudrais savoir s'il est possible de détecter si une page HTML contient une vidéo.Comment détecter si une page HTML contient une vidéo?

Je sais que l'une des façons possibles est de rechercher ".swf" dans le code source HTML. Mais la plupart des pages ne contiennent pas le nom de fichier.

Par exemple, étant donné l'URL suivante et peut-être son code source, est-il possible de savoir si elle contient une vidéo: http://www.cnn.com/video/

+0

En général, cela n'est pas possible. – SLaks

+0

La réponse dépend du langage de programmation que vous souhaitez utiliser pour le détecter. – BalusC

+0

PHP ou JSP ou Java – userlite

Répondre

9

Il y a plusieurs façons pour inclure la vidéo dans une page HTML - comme Flash Video ou instances de lecteurs spécifiques à la plate-forme via <object> et <embed> tags (mais pas chacun de ces tags est une vidéo! La même chose vaut pour .swf - c'est juste l'extension de fichiers Flash, vidéo ou non), le nouveau tag HTML 5 <video> ... Ils ne sont pas impossibles à découvrir, mais il faut beaucoup de travail pour saisir tous les types de joueurs, les formats et les codes d'intégration possibles, et il en résultera beaucoup de faux positifs/négatifs. Ensuite, il y a des bibliothèques JavaScript qui initialisent les lecteurs après le chargement de la page contenant - c'est presque impossible à détecter.

Il est encore un problème très complexe pour obtenir la vidéo en une page Web fiable, et par la suite, il est encore plus complexe pour trouver sur. En fonction de ce que vous essayez d'atteindre, je envisagerais de le laisser tomber.

+0

+ 1 la réponse résume assez bien ... :) –

+0

Salut Pekka, Merci pour la réponse détaillée. – userlite

0

Vérifiez s'il existe une balise <object> dans le DOM et vérifiez son type de contenu et ses paramètres. Vous trouverez le motif par vous-même.

-1

Vous pouvez également rechercher .flv ou .mp4 dans le code source.

+2

C'est extrêmement peu fiable. Un film Flash peut contenir la référence au fichier flv dans le film lui-même. –

+0

Les pages Web joue mp4 ou flv ou .. vidéos via iframe ne contiennent pas le src de la vidéo dans leur source !! –

0

Sur CNN, vous pouvez analyser le micro-balisage Open Graph pour les informations vidéo.

balises Meta tels que og:video:type, og:image

services d'hébergement vidéo soutien généralement micro-balisage, à savoir le graphique ouvert ou scheme.org.

Vous pouvez donc analyser ces annotations.

Questions connexes