Codificare binară uniformă 1

În acest caz, codul binar al alfabetului primar este construit de lanțuri de lungime egală, adică cu aceleași semne asociate cu aceeași cantitate de informații egală cu I (A) = log2N. Pentru a forma semnul sfârșitului semnei nu este necesară, prin urmare, pentru a determina lungimea codului, se poate folosi formula K (A, 2)> log2N. Dispozitivul de recepție numără pur și simplu numărul de semnale elementare stipulate în prealabil și interpretează lanțul (determină ce semn corespunde), corelându-l cu tabelul de coduri. Este adevărat că, în acest caz, eșecurile sunt inacceptabile, de exemplu, sărind peste un semnal elementar va avea ca rezultat o schimbare a întregii secvențe de cod și interpretarea sa incorectă; Problema este rezolvată prin sincronizarea transmisiei sau prin alte mijloace, care vor fi discutate în Ch. 5. Pe de altă parte, utilizarea codului uniform se dovedește a fi unul dintre mijloacele de control al preciziei transmisiei, deoarece faptul de a primi un semnal suplimentar elementar sau, invers, primirea unui cod incomplet este imediat interpretat ca o eroare.







Un alt exemplu important pentru noi de a folosi codificarea uniformă alfabetică este reprezentarea informațiilor simbolice (semn) în computer. Pentru a determina lungimea codului, trebuie să începeți prin stabilirea numărului de caractere din alfabetul principal. Alfabetul de calculator trebuie să includă:

· 26 x 2 = 52 de litere ale alfabetului latin (inclusiv majuscule și litere mici);

· 33 x 2 = 66 de litere ale alfabetului rus;

· Cifre 0. 9 - numai 10;

· Semne de operații matematice, semne de punctuație, simboluri speciale ≈ 20.

Considerăm că numărul total de caractere N ≈ 148. Acum este posibil să se estimeze lungimea șirului de cod K (s, 2) ≥ log2 148 ≥ 7,21. Deoarece lungimea de cod este un număr întreg, evident, K (s, 2) = 8. Aceasta este metoda de codificare adoptată în sistemele informatice: orice simbol este atribuit un cod de 8 biți (8 biți). Această secvență este stocată și procesată ca un întreg (adică, nu au acces la un singur bit) - pentru acest motiv, dispozitiv de calculator capacitate, pentru stocarea de informații sau de prelucrare multiplu de 8. Setul de opt biți înrudite numite octeți, și, astfel, simboluri de reprezentare byte codificare.

Un octet împreună cu un bit poate fi folosit ca unitate pentru măsurarea cantității de informații dintr-un mesaj. Un octet corespunde cu cantitatea de informații dintr-un caracter al alfabetului cu distribuția lor echiprobabilă. Acest mod de măsurare a cantității de informații se numește și volumetric. Să fie un mesaj (secvență de semne); o estimare a cantității de informații conținute în ea conform abordării probabilistice considerate anterior (folosind formula Shannon (2.17)) dă Iver. iar măsura volumului este egală cu Iob; relația dintre aceste cantități rezultă din (2.7):







Este octetul adoptat ca unitate de măsură a cantității de informații din sistemul internațional de unități SI. 1 octet = 8 biți. Împreună cu octet, unitățile mai mari sunt utilizate pentru a măsura cantitatea de informații:

Folosirea șirurilor pe 8 biți vă permite să codificați 2 8 = 256 de caractere, care este mai mare decât cea estimată mai sus N și, prin urmare, vă permite să utilizați restul tabelului de coduri pentru a reprezenta caractere suplimentare.

Cu toate acestea, nu este suficient să convenim doar asupra unei anumite lungimi a codului. Este clar că metodele de codare, i. Există o mulțime de opțiuni pentru a compara semnele alfabetului primar cu lanțuri cu opt biți. Din acest motiv, compatibilitatea dispozitivelor tehnice și furnizarea posibilității de schimb de informații între mulți consumatori necesită negocierea codului. Această coordonare se realizează sub forma standardizării tabelelor de coduri.

Primul astfel de standard internațional, care este utilizat în calculatoare de mari dimensiuni, a fost EBCDIC (Extended Binary Coded Decimal Interchange) - «extins binar codificat de partajare de cod zecimal“. În calculatoarele personale și sisteme de telecomunicații utilizate internațional byte code ASCII (American Standard Code pentru schimbul de informații - «American Standard Code pentru schimbul de informații").

Acesta reglementează codurile de prima jumătate a tabelului de cod (numere de cod 0-127, adică primul bit al codului 0). În această parte a codurilor de toamna litere mari și mici engleză, numere, semne de punctuație și operații matematice, precum și unele coduri de control (numere de la 0 la 31) a produs atunci când se utilizează tastatura. Mai jos sunt cateva FSC -codurile:

Codificare binară uniformă 1

Cea de-a doua parte a tabelului de cod - este considerată extinderea codului principal - acoperă codurile cuprinse între 128 și 255 (primul bit al tuturor codurilor 1). Este folosit pentru a reprezenta simbolurile alfabetelor naționale (de exemplu, rusă), precum și simbolurile pseudo-graficelor. Pentru această parte, există, de asemenea, standarde, de exemplu, pentru simbolurile limbii ruse sunt KOI-8, KOI-7 etc.

La fel ca în tabelul principal, și în extinderea codului său de litere și cifre corespund la ordinea lexicografică (adică ordinea în alfabetul) - aceasta oferă posibilitatea de a automatiza viteza de procesare de text.

În prezent, a apărut un alt standard internațional pentru codificarea Unicode și devine din ce în ce mai utilizat. Caracteristica sa este că folosește codificarea pe 16 biți, adică Pentru a reprezenta fiecare caracter, sunt alocate 2 octeți. Această lungime a codului furnizează 65.536 de caractere pentru alfabetul principal. Aceasta, la rândul său, vă permite să creați și să utilizați un tabel comun de cod pentru toate alfabetele comune.

Înapoi la cuprins: Fundamentele teoretice ale informaticii







Trimiteți-le prietenilor: