Universal grabber de conținut

Sunt aici confuz și am scris un abonament universal de conținut. Funcționează chiar în browser și poate trage imagini, linkuri și RSS. Voi scrie mai multe despre acest instrument.







Grabber - un program care poate colecta date de la o anumită resursă externă. Se întâmplă, de exemplu, cu un ecran grabber. Acesta este momentul în care programul captează ceea ce este afișat (al dvs. sau al altcuiva). Pe Internet, adesea sunt folosiți graberi de conținut.

De obicei grabbers sunt folosite pentru sarcini mici. De exemplu, puteți obține o prognoză meteo.

Uneori grabbers sunt folosite pentru a suplimenta site-ul. Și uneori chiar și pentru principal. De exemplu, acest site este format în întregime din graberi. Grabbery colectează datele de pe Twitter, LastFM și Fromspring.me, le elaborează după cum este necesar și de ieșire ca parte a conținutului site-ului.

Uneori sunt folosite grabbers. spun, nu acte foarte frumoase. De exemplu, puteți scrie un grabber care trage date de la un concurent (sau mai multe) și le pune cu atenție în baza de date, unde pot fi luate deja pentru nevoile lor. Uneori acest comportament este urât și, uneori, foarte util. De exemplu, Yandex.market este construit exact pe baza grabbers. Adevărat că proprietarii magazinului sunt conectați la acest sistem, și nu invers. Dar faptul că proprietarii încă se conectează, arată că serviciul este util și pentru ei.

Dar pe lângă versuri! Există un grabber. de ce este el? Ce se poate face cu ea?

Colectarea unei colecții de imagini

În plus, le va arăta și vă va da o descărcare. Și dacă sunteți un bummer, puteți salva pagina grabber și găsi în dosarul atașat toate imaginile care au fost pe pagina în momentul de salvare.

Mai mult decât atât, de obicei, când sunt așezate seturi mari de poze, care sunt prea leneși sau incomode pentru a-și păstra mâinile, au nume similare. Și puteți utiliza filtrul de rezultate pentru a lăsa doar imaginile de care aveți nevoie.

Colectarea unei colecții de linkuri







Imaginați-vă că ați găsit o galerie de imagini în care toate imaginile sunt mici. Aceasta este doar o previzualizare. Trebuie să faceți clic pe fiecare pentru a deschide o imagine de dimensiune completă. Aceste galerii nu sunt neobișnuite pe Internet și descărcarea lor este complet incomodă.

Cu ajutorul unui hoț poți recurge la un truc.

  • Găsiți toate linkurile către imaginile de pe pagina de galerie
  • Filtrați-le astfel încât să rămână numai linkurile către imagini de dimensiune completă
  • Selectați modul src
  • Dați clic pe spectacol

Acum graber va lua linkuri din fereastra de rezultate și le va afișa în zona de vizualizare nu ca link-uri, ci ca imagini! Au căutat linkuri - au fost afișate imagini. Convenabil!

Grabber RSS

Ce este RSS Am scris deja. Dacă nu știți deja acest lucru, un întreg strat de Internet a alunecat de la tine. RSS este format puternic standardizat, deci este foarte ușor să furi și să îl analizați. Am făcut-o în minunatul meu grabber.

Am limitat comutarea de la formatul RSS la formatul src. Dacă încercați să afișați link-uri ca imagini - nu veți obține nimic oricum. Dacă RSS-ul de care aveți nevoie conține imagini - încercați să vă jefuiți RSS, dar în modul src. Dacă există imagini în panglică, le veți obține.

Acum îți spun cum altfel poți folosi un grabber de minuni. Unul din trucurile pe care vi le-am spus deja. Puteți căuta linkuri și puteți afișa imagini. Desigur, dacă găsiți într-adevăr legături către imagini, nu fișiere html.

De asemenea, puteți colecta linkuri către imagini în locul imaginilor. Acest lucru poate fi util și dacă nu doriți să descărcați toate aceste imagini acum.

Unii administratori răi (sau buni?) Închid accesul la diferite site-uri și nu le puteți accesa. Dar câteodată vreau cu adevărat. De exemplu, citiți prietenii LJ sau citiți Bashorgh.

Dacă sunteți interesat de fișierele css, faceți același lucru, dar pentru modul href cu filtrul "css".

Filtrele au puține setări

Și nu aici! Faptul este că filtrele suportă cele mai regulate expresii! Dacă știți ce este, deja înțelegeți că este foarte puternic să filtrați. Dacă nu, vă voi arăta prin exemple.

(jpeg | png | bmp | gif) - elimină sau frânează linii care conțin subrețele "jpeg, jpg, png, bmp, gif". Unul sau mai multe.

(jpe? g | png | bmp | gif) $ - îndepărtează sau frânează linii care se termină cu același subrevers

Destul de des este suficient.

Preluați toate legăturile externe

În setările robotului există o casetă de selectare "numai pentru acest domeniu". Și dacă vreau să primesc legături numai cu acest domeniu?

Trebuie să găsiți toate linkurile și apoi să filtrați numele domeniului.

Sper că acum a devenit clar cum și de ce poți folosi grabberul miracol. Toate dorințele și sugestiile pot să mă trimită. Și dacă ți-a plăcut - poți comanda ceva de la mine.







Trimiteți-le prietenilor: