Parsim conținut la site-ul său - Agos 24 cartușe de cumpărare, radiodetali în Novosibirsk cu livrare la

Parser de conținut: Introducere

Să presupunem că informația de care suntem interesați este pe un site terț și este actualizată acolo. Desigur, puteți vizita periodic site-ul cu informații, copiați-l și actualizați de pe site-ul dvs. de notorietate: Ctrl + C și Ctrl + V. Dar nu pot merge, și pentru a încredința sarcina unui simplu script - parserul, care la cerere: va merge la site-ul donator, găsiți și sculpta informațiile de care avem nevoie și afișa pe site-ul nostru. Pur și simplu, informații de la un alt site vor fi publicate pe un mod complet automat. Dacă perspectiva este luminoasă pentru dvs. - citim mai departe.







Mi-e dor de gândul la partea etică a acestui caz, vom atinge doar partea tehnică. De asemenea, nu încurajez pe nimeni să folosească această metodă în detrimentul altora! Având în vedere nuanțele tehnice ale acestui caz, puteți să vă pregătiți mai târziu informatori specifici pentru site-ul dvs., să oferiți utilizatorilor informații relevante și relevante. Aici totul depinde de zborul gândurilor tale!

Deci, scriem scriptul nostru, care vine pe un site, scoate o bucată de informații de care avem nevoie și o publicăm pe site-ul nostru - ca și cum nimic nu s-ar fi întâmplat. Nu sunt necesare abilități de programare de la dvs., facem totul în cale și încercați implementarea pe blogul dvs.

Implementarea unui parser în PHP

Poate că cel mai important moment în cazul nostru este căutarea unui donator, adică un site pe care vor apărea informațiile care ne interesează. Site-ul ar trebui să ruleze fără probleme, să-și îndeplinească obligația de a actualiza periodic informațiile și textul să fie deschis (adică prin deschiderea codului sursă al paginii în browser - trebuie să vedem informațiile de care suntem interesați).







Când găsiți site-ul donatorului și pagina necesară pentru parsare, amintiți-vă adresa URL și treceți la etapa următoare. Creați un fișier text în notebook, de exemplu parser.php și puneți în el următorul cod:

// Definiți poziția liniei la care doriți să decupați totul
$ pos = strpos ($ content, 'aici este o bucată de cod / text care este plasat înainte de textul dorit');

/ / Tăiați tot ce merge la poziția de care avem nevoie
$ content = substr ($ conținut, $ pos);

// Exact același mod în care găsim poziția liniei finale
$ pos = strpos ($ content, 'aici este piesa de cod / text care se află la sfârșitul textului de care avem nevoie');

// Tăiați numărul dorit de caractere de la zero
$ content = substr ($ conținut, 0, $ pos);

// dacă textul conține text de care nu avem nevoie, tăiați-l
$ content = str_replace ("text de tăiat", "", $ conținut);

// scoateți textul sparat.
echo $ content;

echo "introduceți aici codul final";
?>

Deci, circa 8 linii de cod și conținutul terților sunt publicate automat pe blogul nostru. Culoarea roșie a codului indică locurile pe care trebuie să le editați, verde - dacă este necesar. Dacă nu este nevoie, atunci puteți să ștergeți aceste linii sau să le împiedicați să fie procesate (adică linii cu text verde) - puneți două tăișuri în fața liniei - //

Aveți nevoie de explicații pentru piesele de cod / text care încadrează textul de care avem nevoie? Totul este simplu, trebuie să specificăm poziția de început și de sfârșit în textul pe care trebuie să îl analizați. Deschidem pagina inițială de pe site-ul donatorului și căutăm textul de care avem nevoie. De regulă, va începe cu un fel de html-markup, ceva de genul acesta -

și se încheie cu aceeași abracadabra - de exemplu,   . Copiați aceste simboluri în pozițiile de început și de sfârșit (linii roșii 2 și 3). Amintiți-vă că scriptul nostru nu conține textul care se află între aceste poziții pe site.

Integrarea parserului în PHP în WordPress

Deci, parserul este gata. Munca sa este testată, rezultatul este satisfăcut. Dar cum să afișați conținut redus pe o pagină sau într-o intrare wordpress?

Dacă vom introduce codul de mai sus pentru a posta WordPress, chiar și în modul HTML, din motive de siguranță script-uri WordPress este pur și simplu taie - cenzura nu a ratat.

Am avertizat că aceasta este cea mai simplă implementare a parserului pe php, dar în unele cazuri nu este necesară mai mult (pentru majoritatea bloggerilor).







Trimiteți-le prietenilor: