2 Prezentarea informațiilor, limbilor, codării

pagina 1
§2 Prezentarea informațiilor, limbilor, codificării. (10 celule).

Din cursul de bază pe care îl cunoașteți:

  • Dezvoltarea istorică a omului, formarea societății umane este asociată cu dezvoltarea discursului, cu apariția și difuzarea limbilor. Limbajul este un sistem de semnare pentru prezentarea și transmiterea informațiilor. Acesta include un alfabet, vocabular (cuvinte), gramatică, punctuație (reguli pentru scrierea de cuvinte și propoziții).

  • Oamenii își păstrează cunoștințele în înregistrările pe diferite media. Suportul de informații este un mediu fizic care conține imagini ale mesajelor. Mesajul face parte din informații. Datorită acestor cunoștințe este transmis nu numai în spațiu, dar și în timp - de la generație la generație.

  • Limbile pot fi naturale, de exemplu, rusă, chineză, engleză și formală (create artificial de om pentru anumite științe sau pentru un anumit scop), de exemplu simboluri matematice, notație muzicală, limbi de programare. În limbile oficiale, fiecare cuvânt are un singur înțeles și un înțeles. Nu au sinonime, omonime.






Scrierea și codificarea informațiilor

Procesul de citire a textului este inversa a procesului de scriere, în care textul scris este transformat în vorbire orală. Citirea poate fi numită decodificare a unui text scris.

De obicei, codarea se referă la traducerea informațiilor dintr-o limbă "umană" într-o limbă oficială, de exemplu într-un cod binar, iar decodificarea este o tranziție inversă.

Obiective și metode de codificare

Și acum acordăm atenție faptului că pot exista multe modalități de codare a aceluiași text în aceeași limbă. Un caracter al mesajului original poate fi înlocuit cu un nou simbol de cod sau mai multe simboluri sau invers - mai multe caractere ale mesajului original sunt înlocuite cu un singur caracter din noul cod.

Există multe moduri de codificare. De exemplu, stenografia este un mod rapid de înregistrare a vorbirii orale. Este deținută doar de câțiva oameni special instruiți - stenografi. Ei reușesc să scrie textul în mod sincron cu discursul vorbitorului. Într-o transcriere, o icoană indică un cuvânt întreg sau o combinație de litere. Decodifică (decodifică) transcrierea poate numai stenograful însuși.

Uită-te la textul transcrierii din Fig. 1.2. Se spune următoarele: "Toți oamenii din lume știu cum să vorbească. Chiar și cele mai primitive triburi au un discurs. Limba este ceva universal și cel mai uman care este în lume ".

Hierogliful chinezesc denotă cuvinte și concepte întregi. Vă puteți gândi la alte modalități de codificare.

Exemplele de mai sus ilustrează următoarea regulă importantă: diferite metode pot fi folosite pentru a codifica aceleași informații; alegerea acestora depinde de o serie de circumstanțe: scopul codării, condițiile. fondurile disponibile. Dacă doriți să scrieți textul la rata de vorbire, faceți-o cu stenogramă; dacă trebuie să transferați textul în străinătate, folosim translit; dacă doriți să prezentați textul într-o formă inteligibilă unei persoane ruse literare, o scriem în conformitate cu regulile gramaticii limbii ruse.

O altă circumstanță importantă: alegerea metodei de codificare a informațiilor poate fi asociată cu modalitatea propusă de prelucrare a acesteia. Discutăm cu exemplul reprezentării numerelor - informații cantitative. Folosind alfabetul rus, puteți scrie numărul "treizeci și cinci". Folosind același alfabet al sistemului numeric zecimal arabic, scriem: 35. Să facem calcule. Spuneți-mi ce înregistrare este mai convenabilă pentru efectuarea calculelor: "treizeci și cinci se înmulțește cu o sută douăzeci și șapte" sau "35 x 127"? Evident, pentru multiplicarea numerelor cu mai multe valori, veți folosi a doua înregistrare.

Observăm că două dintre aceste înscrieri, echivalente în sens, folosesc limbi diferite: prima este rusă naturală, a doua este un limbaj formal al matematicii care nu are o identitate națională. Trecerea de la o reprezentare în limbaj natural la o reprezentare în limbajul oficial poate fi privită și ca codificare. Este convenabil pentru o persoană să utilizeze un sistem zecimal pentru codarea numerelor și un sistem binar pentru un computer.

Utilizate pe scară largă în limbile oficiale ale limbajelor informatice sunt limbile de programare


Istoria metodelor tehnice de codificare a informațiilor

C

2 Prezentarea informațiilor, limbilor, codării
apariția mijloacelor tehnice de stocare și transmitere a informațiilor, noi idei și metode de codificare au apărut. Primul mijloc tehnic de transmitere a informațiilor pe distanțe a fost telegraful, inventat în 1837 de către americanul Samuel-Morse.







Mesajul telegrafic este o secvență de semnale electrice transmise de la un aparat de telegraf prin cabluri către un alt aparat de telegraf. Aceste circumstanțe tehnice au condus-o pe Morse la ideea utilizării a numai două tipuri de semnale - scurt și lung - pentru a codifica un mesaj transmis prin linii telegrafice.

Această metodă de codificare a fost numită cod Morse. În ea, fiecare literă a alfabetului este codificată de o secvență de semnale scurte (puncte) și de semnale lungi (liniuțe). Literele sunt separate una de alta prin pauze - absenta semnalelor.

Tabelul prezintă codul Morse pentru alfabetul rus și englez. Semnele speciale de punctuație în Rusia sunt de obicei scrise cu cuvintele: "punct" - punct, "zpt" - virgulă etc.


Cel mai cunoscut mesaj telegrafic este semnalul SOS dezastru (Salvați sufletele noastre - salvați sufletele noastre). Iată cum arată în Codul Morse: • • • •

Trei puncte indică litera S, trei liniuțe indică litera O. Două pauze separă literele unul de celălalt.

O caracteristică caracteristică a codului Morse este lungimea variabilă a codului pentru litere diferite, astfel încât codul Morse este numit un cod neuniform. Literele care apar în text mai des au un cod mai scurt decât literele rare. De exemplu, codul pentru litera "E" este un punct, iar codul pentru litera "b" constă din șase caractere. De ce se face asta? Pentru a scurta lungimea întregului mesaj. Dar din cauza lungimii variabile a literelor de cod, există problema separării literelor unul de celălalt în text. Prin urmare, trebuie să utilizați o pauză (trecere) pentru partiție. În consecință, Alphabetul Telegrafic al lui Morse este de trei niveluri, deoarece folosește trei semne: un punct, o linie, o trecere.

Un cod de telegraf uniform a fost inventat de francezul Jean Maurice Bodot la sfârșitul secolului al XIX-lea. Au folosit numai două tipuri de semnale. Nu contează cum să le numim: punct și liniuță, plus și minus, zero și unul. Acestea sunt două semnale electrice diferite.

2 Prezentarea informațiilor, limbilor, codării
2 Prezentarea informațiilor, limbilor, codării
2 Prezentarea informațiilor, limbilor, codării

În codul Bodo, lungimea codurilor tuturor simbolurilor alfabetului este aceeași și egală cu cinci. În acest caz, nu există nici o problemă de separare a literelor unul de altul: fiecare cinci semnale este un semn al textului.

Codul Bodo este primul mod din istoria tehnologiei în ceea ce privește informațiile codare binare. Datorită acestei idei, Bodo a reușit să automatizeze procesul de transfer și imprimare a literelor. A fost creat un telegraf de tastatură. Apăsând o tastă cu o anumită literă, se produce semnalul cu cinci semnale care se transmite pe linia de comunicație. Receptorul sub influența acestui semnal imprimă aceeași literă pe o bandă de hârtie.

De la cursul de bază al informaticii, știi că calculatoarele moderne folosesc un cod binar uniform pentru a codifica texte. Fiecare simbol este codat cu opt sau șaisprezece semnale (biți).

Mesajul codat poate fi decodificat în mod unic de la început dacă condiția Fano este satisfăcută: niciun cuvânt de cod nu reprezintă începutul unui alt cuvânt de cod. Mesajul codat poate fi decodat în mod unic de la capăt, dacă este satisfăcută condiția Fano opusă: niciun cuvânt de cod nu este sfârșitul unui alt cuvânt de cod. Starea Fano este o condiție suficientă, dar nu necesară, pentru decodificarea unică.
Sistem de concepte de bază


Limbi de prezentare


Codul Bodo: cod uniform, binar


Pentru persoana: o zecimală cu. a.


Pentru un computer: binar cu. a.

Întrebări de test:

  1. Ce este limba? Ce este inclus în compoziția sa?

  2. Care este mediul de stocare?

  3. Ce este un mesaj?

  4. Care este diferența dintre limbile naturale și cele formale?

  5. Credeți că limba latină este un limbaj natural sau formal?

  6. Ce este codarea și decodificarea?

  7. De ce depinde metoda de codare?

  8. Care este diferența dintre criptare și criptare?

  9. Care este diferența dintre codul uniform și codul neuniform?

  10. Care este avantajul codului Bodo comparativ cu codul Morse?

  11. Care este avantajul codului Morse comparativ cu codul Bodo?
misiuni

  1. Pentru 6 litere din alfabetul latin sunt date codurile lor binare (pentru unele litere de două biți, pentru unele din cele trei litere). Aceste coduri sunt prezentate în tabel:

A B C D E F

00 100 10 011 11 101

Determinați ce secvență de 6 litere este codificată cu un șir binar 011 11 10 00 101 100.

1) DEFBAC 2) ABDEFC 3) DECAFB 4) EFCABD


  1. Pentru a codifica un mesaj format numai din literele A, B, C, D și E, se utilizează un cod binar neuniform:


Ce (numai unul!) Din cele patru mesaje recepționate a fost transmis fără erori și poate fi decodificat:

1) 110000001011110 2) 110000011011110 3) 110001001001110 4) 11 000 001 001 11 10


  1. Pentru a transmite un mesaj format numai din literele A, B, C, D, prin canalul de comunicare, am decis să folosim un cod cu lungime neuniformă: A = 1, B = 01, B = 001. Cum pot codifica litera G astfel încât lungimea codului să fie minimă și este permisă o divizare neechivocă a mesajului codificat în litere?

1) 0001 2) 000 3) 11 4) 101

  1. Pentru a transmite un mesaj format numai din caractere A, B, C și D, se utilizează codarea simbolurilor: A-0, B-11, B-100, G-011. Se transmite un mesaj prin intermediul canalului de comunicare: GABAVAG. Codificați mesajul cu acest cod. Obțineți secvența binară rezultată în codul octal. 1) DBACACD 2) 75043 3) 7A23 4) 3304043


  1. Pentru a transmite un mesaj care constă doar din simbolurile A, B, C și D utilizând canalul de comunicare, se utilizează codarea simbol cu ​​simbol: A-10, B-11, B-110, G-0. Se transmite un mesaj prin canalul de comunicare: WAGBAAG. Codificați mesajul cu acest cod. Reveniți secvența binară primită la codul hexazecimal. 1) D3A6 2) 62032206 3) 6A3D 4) CADBAADC


  1. Un bitmap alb-negru este codat în linie, începând din colțul din stânga sus și terminând în colțul din dreapta jos. Când codificați, 1 înseamnă negru și 0 este alb.






Articole similare

Trimiteți-le prietenilor: