Cum de a traduce site-ul html în cms, blogul webmasterului romanului Chernyshov

Dar! Dacă mai multe zeci, sute sau chiar mii de astfel de articole?
După cum se poate vedea din schema de transfer manual descrisă mai sus, acest proces este extrem de consumator de timp, plictisitor și practic nu este realist pentru o persoană normală. Puțini oameni vor putea să stea câteva zile la rând și să transfere manual câteva mii de articole din documente html în baza de date CMS.







Soluția acestei probleme
În primul rând vreau să fac o rezervare, poate că această variantă este deja descrisă undeva mai sus, sau există modalități mai bune și mai convenabil pentru a rezolva problema, mi-au, din păcate, ochii nu a venit peste, așa că am acționat pe cont propriu și să ajungă la propria lor decizie (poate e ciclism , dar extrem de eficient).

Pentru a rezolva această problemă, am un exemplu specific, pacient testat on-line script PHP conceput pentru a converti toate paginile HTML ale site-ului în intrările de baze de date pentru CMS corectați-mă.

Scriptul poate fi numit un parser inteligent de conținut, cu prelucrarea ulterioară, pregătirea și înregistrarea datelor în baza de date.

Această tehnică a fost testată de mine pe câteva site-uri HTML compuse din câteva sute de pagini până la câteva mii. Și în procesul de lucru au apărut pagini HTML cu design diferit, stiluri și design în general. Dar, datorită lucrului scriptului prin parcurgerea PHP xPath parsarea copacului DOM, nu a fost necesară reconfigurarea serioasă a analizei datelor.







Notă. Pentru rezultate mai bune, pentru a converti site-ul HTML într-un site care rulează pe CMS, este recomandat pentru a colecta date care nu sunt în modul automat, semi-automat, acest lucru este în cazul în care toate lucrările face script-ul, dar vizualizați datele colectate de el înainte de data înregistrării datelor în baza de date. Pentru a mai moderație și detectarea posibilelor erori în colectarea de date cu pagini HTML precum și eventuala necesitate pentru articolele de formatare și de proiectare suplimentare.

Acum, despre deficiențele (dacă se poate numi așa)
Eu nu post acest script în accesul public pentru a descărca și de a lucra mai departe cu ea. Problema este că acest script funcționează individual cu fiecare site html, adică Înainte de a începe, trebuie să faceți setări: xpath pentru a colecta date din arborele DOM, directoare care trebuie să fie ocolite, lucrați cu CNC, lucrați cu imagini și așa mai departe. Se pare că numai un expert care înțelege un număr de subtilități în parsare poate lucra cu el. Și, de asemenea, înțelegerea structurii bazei de date, desigur CMS (tabele și câmpuri din baza de date).

Dacă aveți nevoie să rezolvați această problemă, atunci puteți să mă contactați, pentru o taxă modestă (pentru toate celelalte opțiuni), vă voi face să lucrați cu date despre transferul de conținut în CMS.

Articole similare







Articole similare

Trimiteți-le prietenilor: