Informatică informatică pas cu pas

Pasul 11 ​​Codificarea binară uniformă alfabetică. Byte code.doc

Pasul 11.
Informatică teoretică. Codificarea informațiilor din teoria lui Shannon.
Codificare binară uniformă alfabetică. Cod octet







În acest pas, vom lua în considerare codificarea binară uniformă alfabetică; cod octet.

În acest caz, codul binar al alfabetului primar este construit de lanțuri de lungime egală, adică cu toate caracterele aceeași cantitate de informații referitoare la egal I0. Transmit un placă de capăt este necesar, prin urmare, pentru determinarea lungimii catenei codului poate folosi formula: K (2) log2. Dispozitivul de recepție, pur și simplu contează indicată în prealabil numărul de semnale elementare și interpretează lanț (setat la care aceasta corespunde semn). Este adevărat că, în acest caz, eșecurile sunt inacceptabile, de exemplu, sărind peste un semnal elementar va avea ca rezultat o schimbare a întregii secvențe de cod și interpretarea sa incorectă; Problema este rezolvată prin sincronizarea transmisiei sau prin alte mijloace. Pe de altă parte, utilizarea unui cod uniform este unul dintre mijloacele de a controla în mod corect de transport, din cauza faptului primirii în exces cip sau, în mod alternativ, livrarea de cod incomplet interpretat imediat ca o eroare.

Un alt exemplu important pentru noi de a folosi codificarea alfabetică uniformă este reprezentarea informațiilor simbolice în computer. Pentru a determina lungimea codului, trebuie să începeți prin stabilirea numărului de caractere din alfabetul principal. Alfabetul de calculator trebuie să includă:

  • 262 = 52 de litere ale alfabetului latin (inclusiv majuscule și litere mici);

  • 332 = 66 de litere ale alfabetului rus;

  • cifrele 0. 9 - în total 10;

  • semne de operații matematice, semne de punctuație, simboluri speciale 20.







Considerăm că numărul total de caractere N 148. Acum este posibil să se estimeze lungimea lanțului de cod: K (2) log2148 7,21. Deoarece K (2) trebuie să fie un număr întreg, evident, K (2) = 8. Aceasta este metoda de codificare adoptată în sistemele informatice: orice caracter este atribuit un șir de 8 biți (8 biți). Un astfel de lanț era numit octet. iar reprezentarea simbolurilor în acest fel este codificarea byte.

Un octet împreună cu un bit poate fi folosit ca unitate pentru măsurarea cantității de informații dintr-un mesaj. Un octet corespunde cantității de informații dintr-un simbol alfabetic atunci când acestea sunt distribuite în mod egal. Acest mod de măsurare a cantității de informații se numește și volumetric. Să fie un mesaj (secvență de semne); estima cantitatea de informații conținute în ea conform abordării probabilistice considerate anterior (folosind formula Shannon) dă Iver. iar măsura volumului este egală cu Iob; relația dintre aceste valori:

Este octetul adoptat ca unitate de măsură a cantității de informații din sistemul internațional de unități SI. 1 octet = 8 biți. Împreună cu octet, unitățile mai mari sunt utilizate pentru a măsura cantitatea de informații:

Folosirea șirurilor pe 8 biți vă permite să codificați 2 8 = 256 de caractere, care este mai mare decât cea estimată mai sus N și, prin urmare, vă permite să utilizați restul tabelului de coduri pentru a reprezenta caractere suplimentare.

Cu toate acestea, nu este suficient să convenim doar asupra unei anumite lungimi a codului. Este clar că metodele de codare, i. Există o mulțime de opțiuni pentru a compara semnele alfabetului primar cu lanțuri cu opt biți. Din acest motiv, compatibilitatea dispozitivelor tehnice și furnizarea posibilității de schimb de informații între mulți consumatori necesită negocierea codului. Această coordonare se realizează sub forma standardizării tabelelor de coduri. Primul astfel de standard internațional, care este utilizat în calculatoare de mari dimensiuni, a fost EBCDIC> (Extended Binary Coded Decimal Interchange) - "partajare extins binar codificat zecimal cod". Calculatoarele personale și sistemele de telecomunicații utilizează codul internațional ASCII byte (Codul American Standard pentru schimbul de informații). Acesta reglementează codurile de prima jumătate a tabelului de cod (numere de cod 0-127, adică primul bit al codului 0). În această parte a codurilor de toamna litere mari și mici engleză, numere, semne de punctuație și operații matematice, precum și unele coduri de control (numere de la 0 la 31). Mai jos sunt câteva coduri ASCII:


Tabelul 1. ^ Unele coduri ASCII Semnează, cheie







Articole similare

Trimiteți-le prietenilor: