Codificarea datelor de text

Dacă fiecare simbol alfabet asociat anumit număr întreg (de exemplu, numărul de serie), atunci codul binar pot fi codificate și informații textuale. Opt cifre binare sunt suficiente pentru a codifica 256 de caractere diferite. E suficient pentru a exprima diferite combinații de opt biți de toate caracterele din limbile engleză și rusă, ambele majuscule sau cu litere mici și mărcile de punctuație, simboluri, aritmetice de bază și anumite caractere speciale comune, cum ar fi «§».







Din punct de vedere tehnic, acest lucru pare foarte simplu, dar au existat întotdeauna o complexitate organizațională suficientă. În primele zile de calcul, acestea au fost legate de lipsa de standarde, și este numit acum, dimpotrivă, o abundență de standarde concurente și contradictorii. Pentru întreaga lume aceleași date de text codificate, avem nevoie de codificare de masă comună, și nu este încă posibilă din cauza contradicțiilor dintre simbolurile alfabete naționale, precum și caracterul corporativ de contradicții.

Pentru limba engleză, care a ocupat nișa de facto a mijloacelor de comunicare internaționale, contradicțiile au fost deja abandonate. Institutul Național American de Standarde (ANSI) a introdus sistemul de codificare ASCII (Codul Standard al SUA pentru schimbul de informații). În sistemul ASCII, două tabele de codare sunt fixe - de bază și extinse. Tabela de bază stabilește valorile codului de la 0 la 127, iar tabela extinsă se referă la simboluri cu numere de la 128 la 255.

Primele 32 de coduri ale tabelei de bază, începând cu zero, sunt date producătorilor de hardware (în primul rând producătorii de computere și dispozitive de tipărire). În această zonă se află codurile de control așa-numitele, care nu corespund nici unei caractere de limbă, și, în consecință, aceste coduri nu apar fie pe ecran sau pe dispozitivul de imprimare, dar ele pot controla modul în care producția realizată de alte date.







Începând cu codul de cod 32 127 coduri postate ale alfabetului englez, semne de punctuație, numere, aritmetica și unele caractere auxiliare. Tabelul de bază al codării ASCII este dat în tabelul 1.1.

Sisteme similare pentru codificarea datelor text au fost dezvoltate în alte țări. De exemplu, în URSS, în zona de codificare a acționat koi7 sistem (informații cod de schimb, șapte cifre). Cu toate acestea, sprijin pentru producătorii de hardware și software a condus codul ASCII din SUA la nivelul standardelor internaționale, precum și sistemele naționale de codificare trebuie să „retragere“ la a doua, o parte extinsă a sistemului de codificare, care determină codul de valori 128 la 255. Lipsa unui standard uniform în acest domeniu, a condus la o multitudine de concurente codificări. Doar în Rusia, puteți specifica trei standarde valide de codificare și alte două învechite.

De exemplu, codificarea caracterelor rusești, cunoscută sub numele de codificarea Windows-1251, a fost introdusă "din exterior" de Microsoft, dar, având în vedere amploarea

distribuția sistemelor de operare și a altor produse ale acestei companii în Rusia, este profund înrădăcinată și răspândită (Tabelul 1.2). Această codificare este folosită pe majoritatea computerelor locale care rulează pe platforma Windows.

O altă codificare comună se numește KOI-8 (cod pentru schimbul de informații, opt cifre) - originea sa datează acțiunea Consiliului de Ajutor Economic Reciproc Europa de Est (tablitsa1.3). Astăzi, codificarea KOI-8 este utilizată pe scară largă în rețelele de calculatoare din Rusia și din sectorul rus de Internet.

Standardul internațional, în care este furnizată codificarea caracterelor alfabetului rus, se numește codificarea ISO (International Standard Organization). În practică, această codificare este rar utilizată (Tabelul 1.4).

Pe computerele care rulează în sistemele de operare MS-DOS, pot acționa încă două codificări (codificarea GOST și codarea alternativă GOST). Primul dintre acestea a fost considerat învechit chiar și în primii ani de la apariția tehnologiei computerizate personale, dar acesta din urmă este încă folosit astăzi (vezi Tabelul 1.5).

În legătură cu abundența sistemelor de codificare a datelor de text care operează în Rusia, se pune problema transformării datelor între sisteme - aceasta este una dintre cele mai răspândite sarcini ale informaticii.







Articole similare

Trimiteți-le prietenilor: