Limba xml

Atunci când se utilizează HTML, datele afișate nu sunt legate în mod logic de tagurile utilizate pentru marcare, astfel încât parserii nu pot utiliza etichete pentru a găsi fragmentele necesare ale documentului. În plus, setul limitat de etichete HTML face dificilă utilizarea pentru a afișa informații de specialitate (de exemplu, formule matematice).







Limba XML atrage o atenție deosebită dezvoltatorilor și utilizatorilor de internet. Există noi limbi create pe baza XML, există servere Web care utilizează această tehnologie pentru a organiza informațiile stocate pe ele. Specificațiile complete ale limbilor XML și a limbilor asociate sunt disponibile pe pagina oficială W3C - www.w3.org

HTML este o versiune simplificată a limbajului markup SGML. Mult mai simplu și mai convenabil decât SGML, limbajul HTML vă permite să definiți designul elementelor de document și aveți un anumit set limitat de instrucțiuni - etichete prin care se realizează procesul de marcare. Instrucțiunile HTML sunt destinate, în primul rând, să controleze procesul de afișare a conținutului unui document pe ecranul unui program client și, astfel, să determine modul în care documentul este prezentat, dar nu structura acestuia. Ca parte a bazei de date hipertext descrisă de HTML, se folosește un fișier text care poate fi ușor transferat prin rețea utilizând protocolul HTTP. Această caracteristică, precum și faptul că HTML este un standard deschis și un număr foarte mare de utilizatori are capacitatea de a utiliza posibilitățile de această limbă pentru înregistrarea documentelor, desigur, a influențat creșterea popularității HTML și a făcut-o astăzi principalul mecanism pentru furnizarea de informații de pe web

Cu toate acestea, aplicațiile moderne nu au nevoie doar de un limbaj de reprezentare a datelor pe ecranul clientului, ci și de un mecanism care permite definirea structurii unui document, pentru a descrie elementele conținute în acesta. HTML are un set simplu de comenzi și gestionează cu succes sarcina de a descrie informațiile hipertext afișate de ecranul browserului. Cu toate acestea, datele afișate în sine nu sunt asociate cu acele etichete care sunt utilizate pentru formatare, astfel încât instrumentele de analizor nu au capacitatea de a utiliza etichete HTML pentru a găsi fragmentele documentului de care avem nevoie. Ie întâlnind, de exemplu, o astfel de descriere

Un alt dezavantaj semnificativ al HTML este setul limitat de etichete. Regulile DTD pentru HTML definesc un set fix de descriptori și, prin urmare, dezvoltatorul nu are capacitatea de a introduce etichete proprii, speciale.

Rezumând tot ceea ce sa spus, se poate argumenta că HTML nu satisface pe deplin cerințele elaborate de dezvoltatori pentru limbile de acest fel. HTML completează limbajul XML de marcare a hipertextului, un limbaj puternic, flexibil și convenabil. Care este demnitatea lui?

Termenul XML reprezintă un tip special de document hipertext. Ce este atât de rău în legătură cu documentele text obișnuite și ce este special despre documentele XML?

De fapt, XML este o metodă de marcare a documentelor concepută pentru a forma o structură în documente și pentru a determina relațiile dintre diferitele elemente ale acestei structuri. Pentru a crea o astfel de marcare, există instrucțiuni speciale numite etichete. Etichetele sunt plasate între caractere <и>. Datorită disponibilității etichetelor, prelucrarea automată unificată și formatarea documentelor XML devin posibile. Datorită XML, este de asemenea posibil să se monitorizeze corectitudinea datelor stocate în documente și să se stabilească un singur standard pentru structura documentelor în care pot fi conținute date arbitrare. XML este indispensabil în construcția unor sisteme complexe de informații, în care problema schimbului de informații între diverși consumatori este foarte importantă. Cu XML, puteți să eliminați multe dintre problemele asociate cu incompatibilitățile folosite de diferitele componente.







Un exemplu de document XML tipic

Liniile rămase au o structură ierarhică clar exprimată, în care există o etichetă rădăcină . iar restul etichetelor sunt încorporate în ea. Toate aceste etichete se întâlnesc în perechi, de exemplu, și . sau și . Primul - indică eticheta de deschidere, a doua pereche se închide. Într-un document XML, fiecare etichetă de deschidere trebuie să aibă o pereche închisă.

Rămâne doar să spunem ce semnifică înregistrările și ce pentru, cum ar fi type = "datetime" sau type = "string" în interiorul denumirilor de etichete .