Compresie în codificatorul mpeg 2

Comprimarea în codificatorul MPEG 2 este un proces complex de șase niveluri, sub forma unei structuri ierarhice: bloc-macrobloc-slice (clipping) -frame-grup de cadre-secvență de cadre (Figura 4).

Figura 4 - Structura ierarhică a codării MPEG 2

Mai întâi, fragmente ale imaginii sunt procesate - blocuri - dimensiuni de 8x8 pixeli, care conțin informații despre luminozitate sau crom. Blocul (obiectul principal la care este aplicat DCT) este unitatea structurală de bază peste care sunt efectuate toate operațiile de codare de bază. Matricea blocului este formată din 8x8 = 64 pixeli, adică are 64 de eșantioane. Într-o imagine de televiziune, coloanele de matrice 576/8 = 72 sunt plasate pe verticală și pe orizontală 704/8 = 88 de rânduri de matrice. Ca rezultat, se formează o imagine completă de televiziune din (72x88) = 6336 blocuri, adică matrice de date de luminanță, pe care este posibilă realizarea DCT.

Blocurile de luminozitate Y sunt organizate în macroblocuri (16x16 pixeli), formate din patru blocuri. Macroblocul este obiectul principal pentru compensarea anticipată a mișcării.

Unul sau mai multe macroblocuri adiacente sunt grupate împreună și formează o felie în care 16 pixeli vertical și 16n orizontal (unde n este 1, 2, 3 etc.) de pixeli.

Slice este obiectul principal pentru sincronizare și la restaurarea datelor care formează imaginea. Atunci când apare o eroare în fluxul general de date digitale, decodorul se referă la începutul următorului macrobloc inclus în felie, care îmbunătățește eficiența recuperării și calitatea imaginii. Ordinea de procesare a macroblocurilor în felie este aceeași ca și pentru cursa obișnuită orizontală, adică de la stânga la dreapta și de sus în jos.

În zona de căutare, unul caută macroblocul "propriu" în cadrul curent adiacent cadrului de referință. Zona de căutare include 64x64 pixeli, adică limitate la dimensiunile macroblocului de 4x4.

Astfel, cadrul. constând dintr-un grup de felii, este unitatea codată primară a imaginii transmise. 12. Secvența de 15 de cadre ale unui grup de cadre (GoP - grup de imagine) de trei tipuri (I, P, B), dintre care doar unul l-imagine (interframe) intra-codificate este o referință pentru decodificarea altor cadre (P și B) grup de trei sau patru P-cadru (predictive - prezise) sunt utilizate inter-codare de compensare a mișcării pe cea mai apropiată precedent i-cadru și 8. 10-cadru (bidirecțional - două sensuri) care codifică interframe și prezicerea I- anterior și posterior și P -frames.

Grupul de cadre GoP este prevăzut cu un antet, iar structura de date rezultată este denumită un flux de date elementar.

Figura 5 - O secvență tipică I-, B- și P cadre P-cadru se poate referi numai la clasele I- sau P imagini anterioare, în timp ce B-imagine se poate referi la și la cea precedentă și următorii I- sau P cadre.

Figura 6 - Structura unui grup de cadre (imagini) pentru transmiterea pe un canal de comunicare

Așa cum se poate vedea din fig. 5, după un anumit număr de cadre P și B, urmează din nou cadrul de referință I. Grupul de cadre ar trebui să fie suficient de mare dacă este necesar să se obțină un grad ridicat de compresie a informațiilor. Pe de altă parte, cu cât cadrele de mai multe ori urmează, cu atât este mai bună calitatea imaginii, dar mai multe informații în timp real trebuie transmise pe canalul de comunicare, adică, cu cât este mai mare banda de frecvență. Se consideră optim dacă un cadru I reprezintă o medie de 7 până la 15 cadre P și B.

P-cadre (Fragmente previzionate). Cadrele actuale ale cadrului P sunt codate fie pe baza cadrului precedent de referință I, fie a cadrului anterior de referință P prin predicție în perspectivă. Comparația și derivarea informațiilor despre diferențe dintre cadre are loc pe macroblocuri. În cadrele P actuale, informațiile sunt comparate de macroblocuri cu cadrul de referință I până când apare un fragment nou în orice macrobloc al cadrului curent. Din acest moment, codificarea comută la intraframe, adică se aplică DCT și se formează un nou cadru P, dar deja unul ca referință. În cadrele P de referință, spațiul (datorat DCT) și redundanța temporală (datorită comprimării inter-cadru față de cadrele I de referință) sunt reduse și sunt utilizate ca cadre suport pentru cadrele B. În acest caz, este necesară o mare precizie a recuperării acestora. În cadrele P, comparativ cu cadrele I, comprimarea datelor realizabile este de trei ori mai mare.

Radierele B (cadre interpolate bidirecțional) sunt codificate în funcție de natura scenelor de imagine TV transmise în următoarele moduri:

§ Predicția celui mai apropiat cadru B cel mai apropiat pe baza cadrului anterior de referință I sau P (predicție înainte cu compensare de mișcare).

§ Predicție inversă (predicție înapoi cu compensare de mișcare). Următorul, următorul cadru I sau P servește drept referință. O astfel de predicție se realizează atunci când pe imagine (în cadru) apar zone mari care nu erau în cadrul anterior.

• Predicția bidirecțională bazată pe cadrele I și P anterioare și următoare, adică o combinație de două predicții, este folosită - predicție în perspectivă și predicție inversă - predicție înainte cu compensare de mișcare. Două cadre servesc ca cadre de referință - unul dintre acestea este cel mai apropiat cadru anterior I sau P, iar următorul cel mai apropiat cadru I - sau P - următor.

§ Predicția intraframei fără compensarea mișcării bazată numai pe cadre de tip I. În acest caz, în cadrul actual, informația este comparată pe macroblocurile cu cadrul de referință I și se extrage informația despre diferența dintre acestea. O astfel de predicție este folosită pentru o schimbare bruscă a graficului sau pentru viteze mari de deplasare a unui obiect de imagine.

Articole similare

Pagina anterioară

Pagina următoare

Compresie în codificatorul mpeg 2 - stadopedia

Articole similare

Trimiteți-le prietenilor: