Toute API pour effectuer une recherche dans Google Cache?

Je suis en train de rechercher dans Google cache, donc je dois tirer cette requête:Toute API pour effectuer une recherche dans Google Cache?

http://webcache.googleusercontent.com/search?q=cache:news.ycombinator.com/news+hacker+news

Et obtenir un contenu comme l'horodatage de la page. Mais quand je fais cela en utilisant curl (ruby), cela donne une permission refusée, c'est-à-dire que le raclage est bloqué et que c'était prévu. Donc, y a-t-il un moyen de faire une recherche dans google cache (soit une API ou une sorte de scraping de contournement) et d'extraire des informations comme l'horodatage?

Source

2010-10-23 zengr

Je n'ai pas reçu d'API mais je peux le racler en utilisant hpricot ou nokogiri dans les rails (curl in Rails donne une erreur d'autorisation refusée). Je vais mettre en place le code une fois que je trouverai comment extraire l'horodatage de l'URL ci-dessus en utilisant ces gemmes.

Quelqu'un a une meilleure solution?

Source

2010-10-24 21:02:27 zengr

Cela ressemble il pourrait le faire: http://code.google.com/apis/soapsearch/reference.html#1_2

Source

2012-01-13 11:11:51 Johnny

« L'API de recherche SOAP n'est plus disponible. » – d3vin

Toute API pour effectuer une recherche dans Google Cache?

Répondre

Questions connexes