2009-11-01 3 views
0

suis un newbie dans RoR. Je veux développer une application de rails, ce qui pourrait rechercher les informations de vol de mes app rails, aller chercher les informations de vol de différents sites de compagnies aériennes (par exemple, airasia et les compagnies aériennes malaisie). afficher ces résultats dans mon application rails.
Mon module de recherche devrait inclure les champs de texte suivants:écran raclant avec Ruby on Rails

From: Kuala Lumpur 
To: Dubai 
Departure Date:2/11/2009 
Return date: 19/11/2009 
Departure Time: 12:00 
Number of tickets: 2 

utilisateur obtient d'entrer les informations ci-dessus sur mon site et
un script doit rechercher des vols en fonction de ces informations sur les différentes compagnies aériennes des sites et
afficher les résultats avec l'étiquette de laquelle les compagnies aériennes fournissent ce vol.

pouvez utiliser "Scrapi" ou "Scrubyt"

+4

Avez-vous une question précise ou voulez-vous que quelqu'un d'autre pour écrire t tout pour vous? –

+0

je veux juste une ligne de guide sur hw pour commencer, bt cela ne vous dérange pas si vous pouvez l'écrire pour moi. – hassan

+0

Alors que certains développeurs pourraient froncer les sourcils sur le grattage, la raison était votre question downvoted non pas parce que le grattage est mauvais, mais parce que vous ne semblez pas savoir ce que vous faites. Vous nous montrez un texte clair à titre d'exemple. Le scrappage d'écran implique l'utilisation du code source html pour sélectionner les éléments via leurs attributs et valeurs d'attributs. Vous pouvez utiliser du texte brut pour informer un script de scrape, mais il aura toujours besoin de plus que ce viz. contexte en termes de balises ("div"), d'attributs ("id"), de valeurs ("id = 3"), et/ou de texte ("..> sdfd "),. Recherchez la gemme watir-webdriver. –

Répondre

5

quelqu'un peut-il offrir une aide?

Ne pas. Trouvez un autre régime rapide riche. Ou au moins ne comptez pas sur le grattage de l'écran.

Il y a tellement de potentiel pour elle d'aller mal. Trouvez un autre moyen d'agréger les informations. Utilisez les API si elles existent et stockez les horaires dans les bases de données (elles changent rarement d'une semaine à l'autre). Stocker les choses localement rend les choses plus rapides pour vos clients, cela vous permet également de fournir plus de services.

Voici quelques-uns des problèmes potentiels avec screen scraping:

  • mises à jour mineures des sites sur lesquels vous raclement de casser votre outil.
  • tentatives Grattage de IP de votre serveur peut être niée.
  • Selon les informations, vous pourriez peut-être même être poursuivi.
0

toux toux watir-WebDriver (pierre précieuse)

les DOM ne peut pas cacher