Buldozer, așa cum este


În cazul în care un ochi pe aproape numărul de nuclee în comparație cu procesoarele sale predecesorii FX obține mai rapid autobuz, Hyper Transport 3.1, suport pentru mare viteză DDR3 1866 MHz de memorie, și a crescut până la al treilea nivel de 8 MB cache. În plus, vă atragem atenția asupra unor viteze de ceas suficient de mari, care sunt aproape de și, în unele cazuri, chiar au depășit limita la 4000 MHz. Dacă pornim de la prețul recomandat, quad-core FX 4100 pentru a concura cu dual-core Sandy Bridge și Phenom II X4 mai tineri; rivalii celor șase nuclee FX 6100 vor fi modelele mai tinere Core i5 și Phenom II X6 cu șase nuclee. Opt-modelul FX 8120 si FX 8150 play „liga mare“, în cazul în care domnește în vârstă Core i5 și Core i7, care a arătat încă un nivel mare de performanță. După cum se poate observa, poziționarea noilor procesoare AMD FX le obligă să țină la curent cu foarte grave candidați, astfel încât începătorii au oh cât de dificil!








Microarhitectura buldozerului: structura și caracteristicile de funcționare

Buldozer, așa cum este


Să ne amintim principalele caracteristici ale chipset-ului AMD 990FX. Deci, vă permite să construiască configurația grafică AMD CrossFireX și NVIDIA SLI, din cauza podului de sud SB950 suportă standardul SATA 6 Gb / s, dar în imposibilitatea de a conecta dispozitive USB 3.0. În ceea ce privește placa de baza Socket AM3, bazat pe chipset-ul din generațiile anterioare, ele, de asemenea, vor trebui să sprijine buldozer după firmware upgrade de firmware. Dar depinde deja de modelul specific.

Astfel, baza tuturor procesoare AMD FX este un cip semiconductor, care cuprinde patru module de prelucrare, fiecare dintre acestea fiind prevăzut cu propriul său nivel de matrice cache 2, nivelul de cache partajat 3 din 8 MB, controler de memorie DDR3 bi, controler de autobuz HyperTransport și podul construit în nord.

Buldozer, așa cum este


Evident, modelele mai tinere sunt obținute din chipsuri de înaltă calitate prin dezactivarea blocurilor de funcții individuale. Privind structura de cristal a lui Zambezi, nu ne putem imagina că avem un procesor obișnuit quad-core. De fapt, nu este așa și, mai ales, acest fapt demonstrează structura modulului de calcul - unitatea structurală a procesoarelor AMD FX.

Unitatea de calcul Compoziția include două blocuri de calcule întregi (ALU), fiecare dintre care poate transporta până la patru instrucțiuni pe ciclu de ceas, prevăzute cu stocarea de date proprii cache de nivel 1 de memorie. Toate celelalte blocuri, cum ar fi predictorul ramificațiilor, decodificatorul de instrucțiuni, memoria tampon pentru stocarea instrucțiunilor și matricea cache 2MB de nivel 2, sunt reprezentate într-o singură instanță. Evident, dezvoltatorii au considerat că performanțele acestor unități sunt suficiente pentru a servi două ULE.

Buldozer, așa cum este







În plus, fiecare dintre modulele de calcul are o unitate cu puncte variabile (FPU), care a suferit și modificări semnificative. Deci, un standard de SIMD-extensii adaugă un SSE4.1 set și SSE4.2, precum și instrucțiuni specifice XOP, AES și AVX, care pot îmbunătăți semnificativ performanța dacă este acceptată de software-ul. Interesant pare posibil de a efectua 256-bit instrucțiuni AVX pentru resursele care sunt utilizate odată ce cele două blocuri, fiecare dintre acestea fiind în măsură să se ocupe de comandă pe 128 de biți FMAC. În acest caz, FPU poate efectua simultan două scurte instrucțiuni AVX.

Buldozer, așa cum este

După cum puteți vedea, microarhitectura Bulldozer are capacități computerizate foarte avansate, mai ales în comparație cu generațiile anterioare ale procesoarelor AMD. Cu toate acestea, pentru un astfel de avantaj tehnologic este necesar să se plătească pentru necesitatea de a optimiza cu atenție codul programului. În caz contrar, în special în aplicațiile mai vechi, nivelul de performanță poate fi departe de așteptat.

După cum se poate observa din scurta descriere a proiectului de bază al Buldozer microarhitectura, în ciuda tuturor inovațiile sale, nu este lipsit de unele dezavantaje. Cu toate acestea, fiecare modul de calcul au doar bloc de predictor o ramură fetch instrucțiuni și un decodor de instrucțiuni, care, de altfel, este capabil de manipulare până la patru instrucțiuni pe ciclu. Să vedem cum să se comporte AMD FX în aplicații reale, dar intuiția sugerează că aplicațiile intensive FPU, dar fără optimizarea software-ul pentru noi seturi de instrucțiuni SIMD-, cele mai recente procesoare vor demonstra nivelul de performanță caracteristic pentru modelele quad.

Pe lângă arhitectură, mecanismele de gestionare a consumului de energie s-au schimbat, de asemenea. În ciuda numărului mai mare de tranzistoare și viteze mai mari ale ceasului, chiar și cele mai vechi opt-core AMD FX au un pachet termic care nu depășește 125 de wați. Desigur, un anumit rol a jucat acest proces tehnologic de 32 nm, datorită căruia tensiunea de alimentare nominală nu depășește 1,4 V, dar meritul principal aparține în continuare mecanismelor avansate de reglare a frecvențelor ceasurilor și tensiunilor de alimentare. Prima generație a acestui concept a fost implementată în Phenom II X6, unde în cazul unei sarcini computaționale de cel mult trei fluxuri, frecvențele celor trei miezuri active ar putea fi mărite cu 400 MHz. Procesoarele AMD FX oferă o abordare mult mai flexibilă pentru gestionarea parametrilor cheie de performanță. Deci, datorită utilizării tranzistorilor cu poarta de putere, procesorul de economisire a energiei al procesorului este capabil să deconecteze întreaga blocare a funcțiilor. Dacă nu există nicio încărcătură, modulul de calcul împreună cu arhiva cache a celui de-al doilea nivel pot fi dezactivate complet, eliberând o parte din bugetul TDP. În același timp, frecvența ceasului și tensiunea modulelor active de calcul pot crește, iar creșterea frecvenței în modul Max Turbo atinge un nivel solid de 900 MHz. Sunt de acord, un algoritm agresiv de overclocking automat pe care nu l-am intalnit inca. Mai mult, cu o încărcare uniformă a tuturor modulelor de calcul, este posibilă creșterea frecvenței ceasului de aproximativ 300 MHz. De fapt, acesta este modul de funcționare al Turbo Core și va fi activ până când consumul de energie al procesorului nu va depăși limitele pachetului de căldură. Cu alte cuvinte, însăși noțiunea de "frecvență standard a ceasului" pentru AMD FX își pierde sensul original.

Buldozer, așa cum este


Și totul ar fi foarte bun, dacă nu ar fi atât de trist. De fapt, planificatorul sistemului de operare Windows nu este încă suficient de optimizat pentru procesoarele AMD FX. Există posibilitatea ca cele două fluxuri de aceeași aplicație va rula pe unități de calcul întregi de module diferite, care nu va permite procesorului pentru a intra în modul Max Turbo și va necesita date re-descărcare și cache de instrucțiuni. În mod ideal, sistemul de operare planificatorul trebuie să ia în considerare caracteristicile arhitecturale ale Buldozer, în acest caz, utilizarea combinație de Turbo Core și Turbo Max ar trebui să dea efectul maxim pozitiv.

Buldozer, așa cum este


Deja se știe că planificatorul de sarcini al viitorului Microsoft Windows 8 va fi optimizat pentru lucrul la procesoarele Bulldozer. Și pentru ziua de astăzi, poate fi lansată o actualizare pentru sistemele de operare curente, sau programatorii AMD vor dezvolta în cele din urmă un "driver miraculos" ...







Articole similare

Trimiteți-le prietenilor: