Metoda alfabetică pentru măsurarea informațiilor

Subiect: "Abordarea alfabetică a măsurării informațiilor".

Cea mai simplă modalitate de a înțelege acest lucru este folosirea unui exemplu de text scris într-o anumită limbă. Este mai convenabil pentru noi să avem rusă.







Toate seturile de simboluri utilizate în limba vor fi denumite în mod tradițional un alfabet. De obicei, doar literele sunt înțelese ca alfabete, deoarece semnele de punctuație, numerele și parantezele pot apărea în text, apoi le vom include și în alfabet. Alfabetul ar trebui să includă și un spațiu (spațiul dintre cuvinte).

Numărul total de simboluri ale alfabetului este denumit de obicei puterea alfabetului. De exemplu, puterea alfabetului din literele rusești și personajele suplimentare este de 54.

Imaginați-vă că textul vine la dvs. în mod consecvent, un caracter, ca o panglică de hârtie care iese din unitatea de telegraf. Să presupunem că fiecare simbol care apare pe bandă cu aceeași probabilitate poate fi orice simbol al alfabetului.

Oricare dintre caracterele N poate apărea în fiecare poziție următoare a textului. Fiecare simbol poartă biți de informații; numărul i poate fi determinat din ecuația:

Atât de multă informație este un singur caracter în textul rus! Și acum, pentru a găsi cantitatea de informații în întregul text, trebuie să calculați numărul de caractere din el și să înmulțiți cu i.

Luați de pe raft, o carte și numărați cantitatea de informații pe o pagină a acesteia. Permiteți paginii să conțină 50 de linii. Fiecare linie are 60 de caractere. Deci, pe pagină există 50x60 = 3000 de caractere. Apoi cantitatea de informații va fi:

În consecință, în abordarea alfabetică a măsurării informației, cantitatea de informații din conținut nu depinde. Cantitatea de informații depinde de volumul textului (adică de numărul de caractere din text) și de puterea alfabetului.







Rezultă, de exemplu, că este imposibilă compararea volumelor de informații ale textelor scrise în diferite limbi, numai în funcție de volum. Ei au greutăți de informație ale unui singur personaj, deoarece puterea alfabetelor diferitelor limbi este diferită.

Dar dacă cărțile sunt scrise într-o singură limbă, atunci este clar că există mai multe informații în cartea groasă decât în ​​cea subțire. Conținutul cărții nu este luat în considerare.

Să formuleze regula pentru măsurarea informațiilor folosind o abordare alfabetică.

Cantitatea de informație conținută într-un mesaj de caracter, este egal cu K x i, unde K este numărul de caractere în corpul mesajului, și i - simbol informații în greutate, care se obține din ecuația 2 i = N, unde N - puterea folosită alfabet.

Aplicarea abordării alfabetice este convenabilă în primul rând prin utilizarea mijloacelor tehnice de lucru cu informații. În acest caz, noțiunile de "informații noi - vechi", "inteligibile - incomprehensibile" își pierd importanța. Abordarea alfabetică este o modalitate obiectivă de măsurare a informațiilor, spre deosebire de o campanie subiectivă, informativă.

1. Dovedeste ca, pe baza abordarii alfabetice, un mesaj de orice lungime,

folosind un alfabet de un singur caracter conține zero informații.

În acest caz, N = 1, deoarece 2 ^ i = N, atunci i = 0. pentru că K (numărul de simboluri din mesaj) este arbitrar, îl desemnează cu x. Pentru a găsi cantitatea de informații din text conținând simboluri x (în acest caz) obținem expresia: x * 0. Această expresie va fi 0 pentru orice x. Ce trebuia să dovedească.

2. Două texte conțin același număr de caractere. Primul text este alcătuit dintr-un alfabet cu o capacitate de 32 de caractere, al doilea având o capacitate de 64 de simboluri. De câte ori este cantitatea de informații din aceste texte diferită?

1) N = 32 32 = 2 ^ i i = 5 biți

2) N = 64 64 = 2 ^ i i = 6 biți

a. 20 * 16 = 320 (caractere) - pe foaia lăudabilă.

b. 1600 \ 320 = 5 (biți) - greutatea unui singur caracter.

4. În cartea, scrisă în rusă 68 de pagini. Fiecare pagină are 45 de linii, fiecare linie are 20 de caractere. Cât de multe informații vor fi pierdute din cartea și ce va rămâne dacă studenții nocivi Vovochka Sidorov vorbește în 2 pagini.

1) 45 * 20 = 900 (caractere) - pe o singură pagină.

2) 900 * 68 = 61200 (caractere) - în întreaga carte.

3) 61200 * 54 = 3304800 (bit) - total în carte.

4) (900 * 2) * 54 = 57200 (bit) - se pierde pe două pagini.

5) 3304800-57200 = 3247600 (bit) - stânga.

Răspuns: 57200 de biți sunt pierduți, din care au mai rămas 3247600 de biți.







Articole similare

Trimiteți-le prietenilor: