Manual de informatică pentru avocați și economiști - Capitolul 1

1.6. date și codare

Datele - componenta dialectică a informațiilor. Ele sunt semnale înregistrate. Metoda fizică de înregistrare poate fi orice: mișcarea mecanică a corpurilor fizice, modificarea parametrilor de formă sau de suprafață, modificarea caracteristicilor electrice, magnetice, optice, compoziția chimică și (sau) natura legăturilor chimice, modificarea stării sistemului electronic și multe altele.







În conformitate cu metoda de înregistrare, datele pot fi stocate și transportate pe suporturi de diferite tipuri. Cel mai comun transportator de date, deși nu este cel mai economic, pare a fi hârtie. Pe hârtie, datele sunt înregistrate prin schimbarea caracteristicilor optice ale suprafeței sale. Schimbarea proprietăților optice (modificarea coeficientului de reflexie al suprafeței pe o anumită gamă de lungimi de undă) este de asemenea folosită în dispozitivele care înregistrează cu un fascicul laser pe suporturi de acoperire reflectorizante din plastic (CD-ROM). Ca purtători, folosind schimbarea proprietăților magnetice, se pot numi benzi magnetice și discuri. Înregistrarea datelor prin modificarea compoziției chimice a substanțelor de suprafață ale transportatorului este larg utilizată în fotografie. La nivel biochimic, există o acumulare și transmitere de date în natură.

Sarcina de a transforma datele în scopul schimbării mass-media este una dintre cele mai importante sarcini ale informaticii. În structura costului sistemelor de calcul, dispozitivele de intrare și ieșire a datelor, care lucrează cu mediile, reprezintă până la jumătate din costul hardware-ului.

Operațiuni de date

În timpul procesului de informare, datele sunt convertite de la un tip la altul folosind metode. Prelucrarea datelor implică multe operații diferite. Odată cu dezvoltarea progresului științific și tehnologic și a complicației generale a legăturilor în societatea umană, costurile forței de muncă pentru prelucrarea datelor sunt în continuă creștere. În primul rând, acest lucru se datorează complicației constante a condițiilor pentru gestionarea producției și a societății. Cel de-al doilea factor, care determină, de asemenea, o creștere generală a volumului datelor prelucrate, se referă, de asemenea, la progresul științific și tehnologic, și anume aspectul rapid și introducerea noilor suporturi de date, stocarea și furnizarea de date.

În structura posibilelor operații cu date, se pot distinge următoarele principale:

• colectarea de date - acumularea de date pentru a asigura o completare suficientă a informațiilor pentru luarea deciziilor;

• Formalizarea datelor - aducerea datelor din surse diferite în aceeași formă pentru a le face comparabile, adică pentru a spori nivelul de disponibilitate al acestora;

• Filtrarea datelor - screening-ul de date "inutile", în care nu este nevoie de luarea deciziilor; în același timp, nivelul "zgomotului" ar trebui să scadă, iar fiabilitatea și caracterul adecvat al datelor ar trebui să crească;

• Date de sortare - comandarea datelor conform unei caracteristici specificate pentru comoditatea de utilizare; crește disponibilitatea informațiilor;

• gruparea datelor - combinarea datelor cu o caracteristică specificată pentru a spori gradul de utilizare; crește disponibilitatea informațiilor;

• Arhivarea datelor - organizarea stocării datelor într-o formă convenabilă și ușor accesibilă; servește la reducerea costurilor economice ale stocării datelor și la creșterea fiabilității globale a procesului de informare în ansamblul său;

• protecția datelor - un set de măsuri care vizează prevenirea pierderii, reproducerii și modificării datelor;

• transport de date - recepție și transmitere (livrare și livrare) a datelor între participanții la distanță ai procesului de informare; în timp ce sursa datelor din domeniul informaticii se numește de obicei serverul, iar consumatorul - clientul;

Codare binară a datelor

Aceeași problemă a mijloacelor de codare universală se realizează cu succes în anumite ramuri ale tehnologiei, științei și culturii. Exemplele includ sistemul de înregistrare a expresiilor matematice, alfabetul de telegraf, alfabetul de pavilion naval, sistemul Braille pentru orbi și multe altele.

C O M P U T E R

Fig. 1.8. Exemple de sisteme de codificare diferite

Sistemul său există în informatică - se numește codificare binară și se bazează pe prezentarea secvenței de date doar două cifre: 0 și 1. Aceste semne sunt numite cifre binare, în limba engleză - cifre binare, sau, într-o formă prescurtată, de biți (bit).

Un singur bit poate fi exprimat prin două concepte: 0 sau 1 (da sau nu, negru sau alb, adevărat sau fals, etc.). Dacă numărul de biți este mărit la două, atunci pot fi exprimate patru concepte diferite:

Trei biți pot codifica opt valori diferite:

000 001 010 011 100 101 110 111

Prin creșterea numărului de cifre din sistemul de codare binar cu unul, dublem numărul de valori care pot fi exprimate în acest sistem.

Codificarea numerelor întregi și a numerelor reale

Pentru a codifica numere întregi de la 0 la 255, este suficient să aveți 8 biți de cod binar (8 biți).

Șaisprezece biți vă permit să codificați întregi de la 0 la 65535 și 24 de biți - la mai mult de 16,5 milioane de valori diferite.

Pentru a codifica numere reale, este utilizată o codificare pe 80 de biți. În acest caz, numărul este preconfigurat într-o formă normalizată.

123 456 789 = 0,123456789 · 109

Prima parte a numărului este numită mantisă, iar a doua parte este numită caracteristică. Cele mai multe dintre cele 80 de biți sunt alocate pentru a stoca mantisa (împreună cu semnul) și un anumit număr fix de cifre sunt alocate pentru a stoca caracteristica (de asemenea, cu un semn).

Codificarea datelor de text

Dacă atribuiți un anumit număr întreg fiecărui caracter al alfabetului (de exemplu, un număr de serie), puteți codifica, de asemenea, informații text folosind codul binar. Opt cifre binare sunt suficiente pentru a codifica 256 de caractere diferite. E suficient pentru a exprima diferite combinații de opt biți de toate caracterele din limba engleză și alfabetelor rusă, ambele majuscule și litere mici și mărcile de punctuație, simboluri, aritmetice de bază și anumite caractere speciale comune, cum ar fi «§».

Din punct de vedere tehnic, acest lucru pare foarte simplu, dar au existat întotdeauna o complexitate organizațională suficientă. În primele zile de calcul, acestea au fost legate de lipsa de standarde, și este numit acum, dimpotrivă, o abundență de standarde concurente și contradictorii. Pentru întreaga lume aceleași date de text codificate, avem nevoie de codificare de masă comună, și nu este încă posibilă din cauza contradicțiilor dintre simbolurile alfabete naționale, precum și caracterul corporativ de contradicții.

Pentru limba engleză, care a ocupat nișa de facto a mijloacelor de comunicare internaționale, contradicțiile au fost deja abandonate. Institutul Național American de Standarde (ANSI) a introdus sistemul de codificare ASCII (Codul Standard al SUA pentru schimbul de informații). În sistemul ASCII, două tabele de codare sunt fixe: bază și extinsă. Tabela de bază stabilește valorile codului de la 0 la 127, iar tabela extinsă se referă la simboluri cu numere de la 128 la 255.







Primele 32 de coduri ale tabelei de bază, începând cu zero, sunt date producătorilor de hardware (în primul rând producătorii de computere și dispozitive de tipărire). În această zonă se află codurile de control așa-numitele, care nu corespund nici unei caractere de limbă, și, în consecință, aceste coduri nu apar fie pe ecran sau pe dispozitivul de imprimare, dar ele pot controla modul în care producția realizată de alte date.

Începând cu codul de cod 32 127 coduri postate ale alfabetului englez, semne de punctuație, numere, aritmetica și unele caractere auxiliare. Tabelul de bază al codării ASCII este dat în tabelul 1.1.

Manual de informatică pentru avocați și economiști - Capitolul 1

Sisteme similare de codificare a datelor text au fost dezvoltate în alte țări. De exemplu, în URSS, în zona de codificare a acționat koi7 sistem (informații cod de schimb, șapte cifre). Cu toate acestea, sprijin pentru producătorii de hardware și software a condus codul ASCII din SUA la nivelul standardelor internaționale, precum și sistemele naționale de codificare trebuie să „retragere“ la a doua, o parte extinsă a sistemului de codificare, care determină codul de valori 128 la 255. Lipsa unui standard uniform în acest domeniu, a condus la o multitudine de concurente codificări. Doar în Rusia, puteți specifica trei standarde valide de codificare și alte două învechite.

De exemplu, codificarea caracterelor limbii ruse, cunoscut sub numele de Windows 1251, a fost introdus de la „în afara» - Microsoft acum, dar având în vedere sistemele de operare pe scară largă și alte produse ale companiei din Rusia, ea este profund înrădăcinată și disponibile pe scară largă (Tabelul 1.2 ). Această codificare este folosită pe majoritatea computerelor locale care rulează pe platforma Windows. De facto, a devenit standard în sectorul rus al World Wide Web.

Manual de informatică pentru avocați și economiști - Capitolul 1

O altă codificare comună se numește KOI-8 (cod de schimb de informații, opt cifre) - originea sa se referă la vremurile Consiliului de asistență economică reciprocă a statelor est-europene (Tabelul 1.3). Pe baza acestei codificări, codurile KOI8-R (rusă) și KOI8-U (ucraineană) funcționează acum. Astăzi, codificarea KOI8-P este utilizată pe scară largă în rețelele de calculatoare de pe teritoriul Rusiei și în unele servicii din sectorul rus de Internet. În special, în Rusia este un standard de facto în mesajele de e-mail și în teleconferințe.

Manual de informatică pentru avocați și economiști - Capitolul 1

Standardul internațional, în care este prevăzută codificarea caracterelor alfabetului rus, se numește Organizația Internațională Standard (ISO). În practică, această codificare este rar utilizată (Tabelul 1.4).

Manual de informatică pentru avocați și economiști - Capitolul 1

Pe computerele care rulează în sistemele de operare MS-DOS, pot acționa încă două codificări (codificarea GOST și codarea alternativă GOST). Primul dintre acestea a fost considerat învechit chiar și în primii ani de apariție a calculatoarelor personale, dar acesta din urmă este încă folosit astăzi (vezi Tabelul 1.5).

Manual de informatică pentru avocați și economiști - Capitolul 1

În legătură cu abundența sistemelor de codificare a datelor de text care operează în Rusia, se pune problema transformării datelor între sisteme - aceasta este una dintre cele mai comune sarcini ale informaticii.

Sistem de codificare universală a textului

Dacă analizăm provocările organizatorice asociate cu crearea unui sistem unificat de codificare a datelor de text, atunci se poate concluziona că acestea sunt cauzate de un set limitat de coduri (256). În același timp, este evident că, dacă, de exemplu, caracterele codate nu sunt numere binare de opt biți, și numere cu mai multe cifre, atunci intervalul de valori posibile ale codului va fi mult mai mult. Un astfel de sistem, bazat pe codarea de caractere pe 16 biți, se numește universal - UNICODE. Șaisprezece biți permit să furnizeze coduri unice pentru 65.536 de caractere diferite - acest câmp este suficient pentru a ocupa același tabel simbol cele mai multe dintre limbile lumii.

În ciuda dovezilor triviale unei astfel de abordări, un comutator simplu mecanic la acest sistem pentru o lungă perioadă de timp împiedicată de resursele insuficiente ale echipamentelor informatice (în UNICODE sistem de codificare, toate documentele de text devin automat de două ori mai mult timp). În a doua jumătate a anilor '90 ai mijloacelor tehnice au atins nivelul necesar de disponibilitatea resurselor, și astăzi suntem martorii unui transfer progresiv al documentelor și software pentru sistemul de codificare universal. Pentru utilizatorii individuali, a adăugat mai multe griji pentru a armoniza documentele executate în sistemele de codificare diferite, cu software-ul, dar ar trebui să fie înțeles ca dificultățile perioadei de tranziție.

Codificarea datelor grafice

Dacă luăm în considerare utilizarea unei imagini grafice alb-negru lupă imprimată într-un ziar sau o carte, se poate vedea că este format din mici puncte, care formează un model caracteristic, cunoscut ca un raster (fig. 1.9).

Fig. 1.9. Raster este o metodă de codare a informațiilor grafice,

a fost mult timp acceptată în tipărire

Deoarece coordonatele liniare și proprietățile individuale ale fiecărui punct (luminozitate) pot fi exprimate prin numere întregi, putem spune că codificarea bitmap permite utilizarea unui cod binar pentru a reprezenta datele de imagine. considerată o reprezentare comună astăzi ilustrații alb-negru în combinație cu punctele 256 de nuanțe de gri, și, astfel, pentru a codifica luminanța orice punct este de obicei suficient număr de opt biți binar.

Pentru a codifica graficul color, se aplică principiul descompunerii unei culori arbitrare în componentele principale. Deoarece aceste componente utilizează trei culori primare: roșu (R, R), verde (verde, G) și albastru (albastru, B). În practică, este considerată (deși teoretic nu este așa) că orice culoare vizibilă de ochiul uman poate fi obținută prin amestecarea mecanică a acestor trei culori primare. Un astfel de sistem de codificare se numește sistemul RGB prin primele litere ale denumirilor culorilor primare.

Dacă utilizați valoarea de 256 (opt biți), așa cum este cazul pentru o jumătate de tonuri imagini alb-negru, codul de culoare de pe un singur punct necesar să-și petreacă 24 de biți pentru a codifica luminanța fiecare din componentele principale. În acest caz, sistemul de codificare oferă o definiție clară a 16,5 milioane de culori diferite, care este de fapt aproape de sensibilitatea ochiului uman. Modul de reprezentare a graficii color folosind 24 de biți se numește culoare plină (True Color).

Fiecare dintre culorile primare poate fi asociată cu o culoare suplimentară, adică o culoare care completează culoarea principală cu cea albă. Este ușor de observat că pentru oricare dintre culorile primare, culoarea suplimentară va fi culoarea formată din suma perechii de alte culori primare. În consecință, culorile complementare sunt: ​​cyan (Cyan, C), Magenta (Magenta, M) și galben (Yellow, Y). Principiul oricărei descompunere de culoare în componentele sale constitutive pot fi utilizate nu numai pentru culorile primare, dar, de asemenea, pentru alte, adică, orice culoare poate fi reprezentat ca suma cyan, magenta și componenta galben. Această metodă de codificare a culorilor este adoptată în poligrafie, dar în imprimare se utilizează și a patra vopsea - negru (negru, K). Prin urmare, acest sistem de codificare este notat cu patru litere CMYK (negru notate cu litera K, pentru litera B este deja ocupat în albastru), și pentru a reprezenta grafica de culoare în acest sistem trebuie să aibă 32 de biți. Acest mod este denumit și culoarea completă (True Color).

Dacă reduceți numărul de biți utilizați pentru a codifica culoarea fiecărui punct, puteți reduce cantitatea de date, dar gama de culori codificate este semnificativ redusă. Codarea graficelor color cu numere binare pe 16 biți se numește modul High Color.

Când se codifică informațiile de culoare utilizând cei opt biți de date, pot fi transmise numai 256 de culori. Această metodă de codificare a culorilor se numește index. Semnificația numelui este faptul că, din moment ce cele 256 de valori destul de suficient pentru a transmite întreaga gamă de culori disponibile pentru ochiul uman, codul fiecare pixel exprimă nu este culoarea în sine, ci doar numărul (index) la un anumit tabel de numit o paletă. Desigur, această paletă trebuie să fie aplicat la datele de imagine - fără ea nu se poate utiliza metodele de reproducere a informațiilor de pe ecran sau hârtie (care este, utilizarea, desigur, posibil, dar din cauza incompletitudinea datelor obținute informații nu vor fi adecvate: frunzele de pe copaci pot fi de culoare roșie, iar cerul este verde).

Codificarea informațiilor de sunet

Tehnicile și metodele de lucru cu informațiile audio au venit la tehnologia calculatoarelor cel mai recent. În plus, spre deosebire de datele numerice, text și grafice, înregistrările sonore nu au avut o istorie de codare la fel de lungă și dovedită. Ca rezultat, metodele de codare a informațiilor audio cu cod binar sunt departe de standardizare. Multe companii individuale și-au dezvoltat propriile standarde corporative.







Trimiteți-le prietenilor: