Étant donné que Gmail ne fournit aucune API pour obtenir ces informations, il semble que vous souhaitiez en faire web scraping.
racler Web (également appelé Web la récolte ou l'extraction de données Web) est une technique de logiciels de extraire des informations à partir de sites
Il existe de nombreuses façons de le faire, comme mentionné dans le wikipedia article lié avant:
humain copier-coller: Parfois, même la meilleure technologie de grattage Web peut pas remplacer l'examen manuel de l'homme et copier-coller, et parfois ce peut être la seule solution réalisable lorsque les sites Web pour gratter explicitement des barrières d'installation pour empêcher la machine automatisation.
Grepping texte et expression régulière correspondant: Une approche simple et puissant pour extraire des informations à partir pages Web peuvent être basées sur la commande grep UNIX ou une expression régulière installations correspondants des langages de programmation (par exemple Perl ou Python).
programmation HTTP: statique et dynamique pages Web peuvent être récupérées en affichant requêtes HTTP au serveur Web distant en utilisant la programmation socket.
analyse syntaxique DOM: En intégrant un navigateur Web à part entière , comme l' Internet Explorer ou le contrôle du navigateur Web Mozilla, les programmes peuvent récupérer le contenu dynamique généré par scripts côté client. Ces commandes du navigateur Web analysent également les pages Web dans un arbre DOM , en fonction des programmes qui peuvent récupérer des parties des pages Web.
HTML parseurs: Certains langages de requête de données semi-structurées, telles que le langage de requête XML (XQL) et le langage de requête hyper-texte (HTQL), peuvent être utilisés pour analyser les pages HTML et extraient et transformer le contenu Web.
logiciel Web-grattage: Il y a beaucoup logiciel Web-grattage disponible que peut être utilisé pour personnaliser le Web grattage solutions. Ces logiciels peuvent fournir une interface d'enregistrement Web qui supprime la nécessité d'écrire manuellement codes Web-grattage, ou certaines fonctions de script qui peuvent être utilisés pour extraire et transformer le contenu Web et interfaces de base de données qui peuvent stocker le gratté données dans des bases de données locales.
annotation sémantique reconnaissant: Les pages Web peuvent adopter des métadonnées ou /annotations sémantiques majorations qui peuvent être mis à profit pour localiser les données spécifiques extraits. Si les annotations sont incorporées dans les pages, comme le fait Microformat , cette technique peut être considérée comme un cas spécial d'analyse DOM. Dans un autre cas, les annotations, organisées en une couche sémantique 2, sont stockées et gérées séparés pour les pages Web, de sorte que les racleurs Web peuvent récupérer schéma de données et les instructions de cette couche avant de gratter les pages.
Et avant que je continue, gardez à l'esprit le legal implications de tout cela. Je ne sais pas si c'est conforme aux termes de gmail et je vous recommande de les vérifier avant d'aller de l'avant. Vous pourriez aussi finir par être sur une liste noire ou rencontrer d'autres problèmes comme celui-ci.
Tout cela étant dit, je dirais que, dans votre cas, vous avez besoin d'une sorte d'araignée et analyseur DOM pour se connecter à gmail et trouver les données que vous voulez. Le choix de cet outil dépendra de votre pile technologique. Comme un dev de ruby, j'aime utiliser Mechanize et nokogiri. En utilisant PHP, vous pouvez jeter un oeil à des solutions comme Sphider.
Juste pour clarifier, je n'ai pas besoin de me connecter à gmail, c'est une simple page "Bienvenue sur Gmail", avant de vous connecter. – Docstero
Avez-vous besoin de plus d'informations pour accepter une réponse? – marcgg