Codarea ascii - stadopedie

Material pentru auto-studiu pe tema Cursuri 2

Tabela de codare ASCII (ASCII este codul american standard pentru schimbul de informații).







În total, 256 de caractere diferite pot fi codificate folosind tabela de codare ASCII (Figura 1). Acest tabel este împărțit în două părți: principale (cu coduri de la OOH la 7Fh) și suplimentare (de la 80h la FFh, unde litera h desemnează codul aparținând sistemului hexazecimal).

Pentru a codifica un caracter din tabel, sunt alocate 8 biți (1 octet). La procesarea informațiilor text, un octet poate conține codul unor caractere - litere, numere, punctuație, marcaj de acțiune etc. Fiecare caracter are propriul cod sub forma unui intreg. În acest caz, toate codurile sunt colectate în tabele speciale, numite tabele de codificare. Cu ajutorul lor, codul de simbol este transformat în reprezentarea lui vizibilă pe ecranul monitorului. Ca rezultat, orice text din memoria calculatorului este reprezentat ca o secvență de octeți cu coduri de caractere.

De exemplu, cuvântul salut! va fi codificat după cum urmează (tabelul 1).

Figura 1 prezintă caracterele incluse în codarea standard (engleză) și extinsă (rusă) ASCII.

Prima jumătate a tabelului ASCII este standardizată. Conține coduri de control (de la 00h la 20h și 77h). Aceste coduri sunt eliminate din tabel, deoarece acestea nu aparțin elementelor de text. Aici sunt plasate semne de punctuație și semne matematice: 2lh -. 26h - , 28h - (, 2Bh - + litere mari și mici latine: 41h - A, 61h - a.

A doua jumătate a tabelului conține fonturi naționale, simboluri pseudo-grafice, din care pot fi construite mese, semne matematice speciale. Partea inferioară a tabelului de codare poate fi înlocuită utilizând programele auxiliare de control ale driverelor. Această tehnică vă permite să aplicați mai multe fonturi și căștile acestora.







fiecare cod de caractere de afișare ar trebui să afișeze imaginea simbol - cod nu doar digital și imaginea sa corespunzătoare ca fiecare personaj are propria forma sa. Descrierea formei fiecărui simbol este stocată în memoria specială a afișajului - un generator de caractere. Afișarea unui simbol pe ecranul IBM PC, de exemplu, se realizează utilizând punctele care formează matricea de caractere. Fiecare pixel dintr-o astfel de matrice este un element de imagine și poate fi luminos sau întunecat. punct întunecat este codat 0, luminos (luminos) - 1. Dacă în matricea reprezintă câmpul de pixeli negri marcați punctul și lumină - o stea, puteți portretiza o formă caracter grafic.

Oamenii din diferite țări folosesc simboluri pentru a scrie cuvintele din limbile lor materne. În prezent cele mai multe aplicații, inclusiv sisteme de e-mail și browsere web, sunt pur și simplu pe 8 biți, adică, ele pot afișa și în mod corect percepe doar caractere de 8 biți, în conformitate cu standardul ISO-8859-1.

Există mai mult de 256 de caractere în lume (dacă țineți cont de limba chirilică, araba, chineză, japoneză, coreeană și thailandeză) și apar noi simboluri. Și aceasta creează următoarele lacune pentru mulți utilizatori:

Nu este posibil să utilizați caractere din seturi de codare diferite în același document. Din moment ce fiecare document text utilizează propriul set de codificări, este foarte dificil să recunoască automat textul.

Există personaje noi (de exemplu, Euro), având ca rezultat ISO este în curs de dezvoltare un nou standard ISO-8859-15, care este foarte similar cu standardul ISO-8859-1. Diferența este următoarea: din vechile simboluri standard de codare-ISO 8859-1 se referă la masa monedelor vechi au fost eliminate, care nu este utilizată în prezent, pentru a face loc pentru caractere noi (cum ar fi Euro). Ca rezultat, utilizatorii de pe discuri pot avea aceleași documente, dar în diferite codificări. Soluția la aceste probleme este adoptarea unui set internațional unic de codare, numit codificare universală sau Unicode.







Articole similare

Trimiteți-le prietenilor: