Jump to content

web lapu automātiska lasīšana


_dunduks_
 Share

Recommended Posts

Interesē tāda lieta kā dinamiskā web lapu automātiskā lasīšana.

Kpnkrēti interesē dažādās avio lapas (flyfiesta, e-bookiers u.tml.), lai es varētu mēkēt avenes piedāvājumus.

Tā kā nav laika visu pašam čekot, interesē kāds automātisks risinājums. Problēma ir tā, ka nav konkrēta maršruta (padomā ir tikai virziens) un gribētos atrast ļoti saldu cenu. Vēl lielāka problēma ir tā ka no programmēšanas saprotu kaut ko visual basic pamatlīmenī.

Jautājums: ar kādiem atslēgas vārdiem un ko tieši man vajadzētu googlē meklēt, lai sāktu to pamatlīmenī apgūt.

 

gribu izveidot kādu robotu, lai man uz epastu atsūta sacukurotu lidojuma piedāvājumu.

Link to comment
Share on other sites

Artic^MX

Varbūt ir kādi krietni foršāki risinājumi, bet es izmantotu php + curl, un regexp.

 

P.S. savā laikā ar šo sanāca izveidot diezgan foršu robotiņu, kas vāca balsis Zelta Zivtiņas Z-Klasei.

Robotiņš vazājās pa konkrētām web-lapām, meklēja bezmaksas proxy. Pēc tam jaunatrastos proxy izmantoja, lai nobalsotu.

Labots - Artic^MX
Link to comment
Share on other sites

BlackHalt

Varbūt der palasīt "latviešu literatūra" vai "Kā pareizi noformulēt savu domu"?

Link to comment
Share on other sites

Kamēr tavs robots to info par aviobiļetēm vāks, tikmēr tā maļina jau būs beigusies. Cenas vienam un tam pašam lidojumam ar normālām aviokompānijām mainās pa minūtēm.

Link to comment
Share on other sites

DjUbuntu

meerkakjis pats nemaak rakstiit :>

reaaali shitaadu lietu jau ir sataisiijushi hipmunk.com  . ja nu  gribaas rakstiit savu tuuli, tad var reaali iiizi uztaiisiit skriptu, kas meklee lapaas un suuta rez. uz e-pastu, bet rezultaatu analiize buus intelektuaali izaicinoshaaks darbs, njemot veeraa visus iesaistiitos mainiigos - ilgums, paarseeshanaas, iesp. papildpakalpojumi utt. 

]

Link to comment
Share on other sites

_dunduks_

 

 

ja nu gribaas rakstiit savu tuuli, tad var reaali iiizi uztaiisiit skriptu,
nu bet tieši to arī gribu, bet man tas īzzī neliekas, tāpēc prasu, no kuras puses google sākt rakt?

Rezultātu interpretēšana šajā gadījumā būtu vienkāršākais.

Link to comment
Share on other sites

nevertell

Izvēlies savu mīļāko (vai to, kas vismazāk atbaida) skritpēšanas valodu un meklē, kā tajā uzrakstīt crawler'u. Patiekšu tev gan priekšā, ka SkyScanner to jau ir izdarījuši. 

 

Ņem vērā, ka tev būs jācīnās gan ar botu aizsardzību, gan cenu variēšanu atkarībā no tā, cik bieži tava IP ir veikusi pieprasījumus. Kā arī atpazīt visus netiešos ceļus līdz galamērķim būs netikai resursietilpīgs bet arī netriviāls process. Piemēram no Rīgas uz Skotiju vislētāk ir lidot caur Zviedriju vai Norvēģiju vai Briseli, atkarībā no datumiem. 

Ja gribēsi datus smuki glabāt turpmākai analīzei, tad visgudrāk būtu uzrakstīt crawler'i, kas vienkārši sql'ā (a kautvai sqlite) met iekšā reisus un tikmēr tu backgroundā lasi to datubāzi un analizē, meklē to, ko tev vajag. Nebūs nekas "ready-made".

Link to comment
Share on other sites

DjUbuntu

 g00gle vajag saakt no rakt ... ar laapstu no kreisaas divus metrus. pa labi :> 

 es jauno hackeru zjurnaalaa izlasiiju, ka reaali kruta buutu izmantot scrapy ( http://scrapy.org/ ) + saliec tos datus postgres (njemot veeraa postgis, tev buus iespeeja arii normaali atlasiit ne tikai caur lidosta => lidosta, bet arii no seerijas latvija => juudeeja. .

Link to comment
Share on other sites

Izveido kontu, vai pieraksties esošajā, lai komentētu

Jums ir jābūt šī foruma biedram, lai varētu komentēt tēmas

Izveidot jaunu kontu

Piereģistrējies un izveido jaunu kontu, tas būs viegli!

Reģistrēt jaunu kontu

Pierakstīties

Jums jau ir konts? Pierakstieties tajā šeit!

Pierakstīties tagad!
 Share

×
×
  • Izveidot jaunu...