Php parsing html, folosind simplu html dom - extensie joomla generator

Doar urmați toți pașii articolului și învățați multe lucruri noi și utile pentru dvs.!

Pasul 1 - Pregătirea

Pentru a începe, trebuie să descărcați o copie a librăriei de domenii simple HTML. Descărcarea este gratuită.







DESCĂRCAȚI DOM HTML simplu

În arhivă veți găsi mai multe fișiere, dar avem nevoie doar de o singură - simple_html_dom.php. Toate celelalte sunt exemple și documentație.

Pasul 2 - Elementele de bază ale parsingului HTML

Această bibliotecă este foarte ușor de folosit, dar totuși, trebuie să înțelegeți câteva dintre elementele de bază înainte să o utilizați.

Obținerea accesului la obiectele HTML DOM

Să presupunem că avem deja un obiect DOM, structura, ca în imaginea de mai sus. Puteți începe să lucrați cu aceasta folosind metoda find () și creând colecții. Colecțiile sunt grupuri de obiecte, găsite folosind selectori - sintaxa este oarecum similară cu jQuery.

Folosind acest exemplu de cod HTML, învățăm cum să accesăm informațiile conținute în al doilea paragraf (p). De asemenea, vom schimba informațiile primite și vom afișa rezultatul pe afișaj.

După cum puteți vedea, implementarea parsarea în PHP a unui document HTML este foarte simplă, utilizând o bibliotecă HTML simplu DOM. În principiu, în această bucată de cod PHP, totul poate fi înțeles intuitiv, dar dacă vă îndoiți de ceva, vom examina codul.

Linia 2-4. conectăm biblioteca, creăm un obiect de clasă și încărcăm codul HTML din șir.

Linia 7: Folosind această linie găsim totul

etichete din codul HTML și salvați o variabilă ca matrice. Primul paragraf va avea un index de 0, restul paragrafelor vor fi indexate 1,2,3 ...

Linia 10: Avem conținutul al doilea paragraf din colecția noastră. Indicele său va fi 1. De asemenea, modificăm textul utilizând atributul text interior. Atributul innertext, modifică tot conținutul din eticheta specificată. De asemenea, putem schimba eticheta în sine cu ajutorul atributului exterior.

Să adăugăm încă o linie de cod PHP, cu care vom aloca o clasă de stil paragrafului nostru.

Rezultatul executării codului nostru va fi următorul document HTML:

Mai jos sunt alte exemple de selectori. Dacă ați folosit jQuery, atunci în biblioteca simplă html dom sintaxa este ușor similară.

Biblioteca documentație simplu HTML DOM

Dați-vă doar o ilustrație care arată posibilele proprietăți ale elementului HTML DOM selectat.

Php parsing html, folosind simplu html dom - extensie joomla generator

Pasul 3 - Un exemplu real de parsare PHP a unui document HTML

Php parsing html, folosind simplu html dom - extensie joomla generator

Pasul 4 - Scrieți funcția principală a PHP parser HTML

Mai întâi, numim matricea noastră globală, pe care am specificat-o mai devreme. Creați un nou obiect simple_html_dom. Apoi, încărcați pagina pe care o vom analiza.







Pasul 5 - Găsiți informațiile de care aveți nevoie

În această bucată de cod, totul este extrem de simplu, găsim toate div cu class = nume_material. Apoi, citiți colecția de elemente și selectați numele materialelor. Toate materialele vor fi stocate în matrice în această formă:

Pasul 6 - Rezultatul rezultatului analizei

Pentru început, vom instala câteva stiluri pentru frumusețea informațiilor de ieșire obținute în timpul parsării.

Apoi, folosind câteva linii de cod PHP, vom afișa informațiile.

Rezultatul acestui script va fi o listă cu titlurile articolelor de pe site-ul sitear.ru.

concluzie

Deci am învățat php parsarea documentelor html. Amintiți-vă că parsarea este un proces lung. O pagină poate fi analizată aproximativ o secundă. Dacă parcurgeți un număr mare de documente HTML, serverul dvs. poate întrerupe funcționarea scriptului din cauza expirării timpului alocat pentru execuție. Aceasta poate fi corectată utilizând funcția set_time_limit (240); 240 este timpul în secunde pentru ca scriptul să ruleze.

Php parsing html, folosind simplu html dom - extensie joomla generator

Hole în com_content

Php parsing html, folosind simplu html dom - extensie joomla generator

Trateazăm un virus pe un site

Inspecția inițială a site-ului a constatat că clientul a restricționat accesul la FTP, ceea ce a redus gama de vulnerabilități suspectate, astfel încât a existat o deschidere într-un fel de motor de script Joomla. Kaspersky Yar.

Php parsing html, folosind simplu html dom - extensie joomla generator

Troj / JSRedir-MH

Din nou, a fost un tunet de tunet de site-uri de către un nou virus Troj / JSRedir-MH. Și așa, pe scurt, virusul Troj / JSRedir-MH. Un virus sau un troian este mult mai interesant decât predecesorii săi, acum.

Actualizarea extensiei pentru adresa de e-mail JK

Astăzi, voi împărți câteva informații interesante pentru proprietarii de site-uri colectate de John. Mai devreme sau mai târziu, este sarcina de a subscrie și de a trimite informații de pe site, poate fi o altă setare a problemei.

Php parsing html, folosind simplu html dom - extensie joomla generator

Bună, adică 10 regulat

Kunena înlocui linkul cu profilul utilizatorului

Salut, din nou, din nou, cunen, a primit o sarcină pentru a termina forumul popular Kunena, astăzi a fost necesar să se schimbe legătura cu profilul utilizatorului. Acest lucru se datorează faptului că site-ul este social.

Lucrează pe Kunena - de ce în fiecare pagină?

Kunena scapă de citare inutilă

Pentru cei care fac într-adevăr un site pentru oameni, următoarea mea notă. Îți voi spune cum să scapi de cotații suplimentare în postările de pe forumul kunena. Am câteva site-uri tematice cu o vizită normală.

Procesarea parametrilor extensiei Joomla

Atunci când dezvoltați extensii pentru Joomla CMS, cum ar fi plug-in-uri, module, componente sau șabloane, devine adesea necesară obținerea parametrilor unei extensii dezvoltate sau a oricărei alte extensii. În asta.

Modelul Kunena se prăbușește

1. În folderul \ components \ com_kunena \ template \ your_pattern \, găsim fișierul template.xml și inserați o piesă (astfel încât să puteți selecta dacă doriți să afișați acest câmp sau nu):



Trimiteți-le prietenilor: