Intel dezvaluie detalii despre arhitectura Grafica Noua Gen11
Printr-un anunt neasteptat, Intel a postat arhitectura grafica noua pentru Gen11 pe site-ul lor. Articolul pune in lumina reflectoarelor detalii de finete ale noului motor grafic care va debuta in curand cu procesoarele de 10 nm Ice Lake.
Intel a anuntat noua placa grafica Gen11 la recenta Zi a Arhitecturii, spunandu-ne ca echipa de ingineri pentru Gen11 s-a focalizat cu tarie in crearea
unei imbunatatiri importante de performanta fata de motoarele grafice
Gen anterioare precizand ca obiectivul a fost sa inghesuiasca un
teraflop de 32 de biti si doi teraflopi de 16 biti performanta in
virgula mobila intr-o invelitoare de putere redusa. Primele indicatii
sunt ca placa grafica Gen11 asigura o imbunatatire substantiala a
performantei in lumea reala.
Date fiind faptele si cifrele pe care compania le-a prezentat, putem sa interpretam in mod rezonabil preformanta bruta a acestor procesoare grafice integrate in zona nucleelor Radeon Vega 8 care vin odata cu Ryzen 3 2200G. Acesta ar fi momentul pentru o imbunatatire majora pentru motorul grafic prestabilit care se incorporeaza cu aproape fiecare procesor principal Intel, insemnand o lovitura pentru placile grafice low-end de la Nvidia si AMD.
Arhitectura grafica pentru Gen11
Metrici principali | Gen9 GT2 | Gen11 GT2 |
Atribut Slice | ||
Numarul de slice-uri | 1 | 1 |
Numarul de sub-slice-uri | 3 | 8 |
Numarul de nuclee (EU-uri) | 24 (3x8) | 64 (8x8) |
Precizie intreaga FLOP-uri / Clock (MAD) | 384 | 1024 |
Jumatate de precizie FLOP-uri / Clock (MAD) | 768 | 2048 |
Fisierul de inregistrare total | 672KB (=3x22 4KB) | 1792KB (=8x22 4KB) |
Numarul de sample-uri | 3 | 8 |
Point/Bilinear Texel's/Clock (32bpt) | 12 | 32 |
Point/Bilinear Texel's/Clock (64bpt) | 12 | 32 |
Memoria locala partajata | 192KB (=3x64KB) | 512KB (=8 x 64KB) |
Slice-Atributele principale | ||
Cache-ul L3 | 768KB | 3072KB |
Atribute globale | ||
Largimea de banda GTI (Bytes/Clock) | R: 64 W: 32 | R:64 W:64 |
Configuratia LLC | 2 - 8 MB | TBD |
Configuratia DRAM | 2x64 LPDDR3/DDR4 | 4x |
Documentatia de la Intel stabileste ca procesoarele grafice se bazeaza pe constructia de 10nm de la Intel prin generatia a treia a tehnologiei FinFET. Asa cum ne asteptam, suporta toate API-urile importante. Intel a realizat suport de pana la 4x32 biti LPDDR4/DDR4, o imbunatatire notabila de la suportul 2x64 biti LPDDR4/DDR4 al procesoarelor grafice Gen9.
In domeniul hardware Proreparatii va veni in curand in sprijinul utilizatorilor care doresc upgrade la noile procesoare grafice Gen11 de la Intel oferind reparatii calculatoare si reparatii calculatoare sector 4, iar pentru a realiza acest upgrade iti oferim si asistenta it. Pentru a beneficia de aceste servicii acceseaza siteul de la adresa https://www.proreparatii.com
Procesoarele grafice Gen9 au dispus un aranjament modular familiar cu sub-slice-uri care gazduiesc opt unitati de executie (EU - Execution Unit). Intel a realizat designul pentru Gen11 pana la opt sub-slice-uri, sau 64 de unitati de executie (EU-uri), in cele mai cunoscute variante GT2, dar ele pot fi modificate pentru anumite design-uri. In orice caz, aceasta este o imbunatatire mare fata de 24 EU-uri ale procesoarelor Gen9, totalizand o imbunatatire cu 2.67x in puterea de calcul. Motorul restructurat proceseaza de asemenea doi pixeli / clock.
Dupa cum putem vedea mai sus in diagrama blocului de baza a unui procesor Ice Lake, designul lui Intel SOC (System On a Chip), care este utilizat in nucleele procesoarelor lor de serie, este conectat printr-un inel de interconectare care leaga impreuna nucleele CPU, nucleele GPU, LLC (Last Level Cache) si functiile agentului de sistem (PCIe, memoria si controlerele de ecran). Acest aranjament confirma ca Intel utilizeaza interconectarea ring-bus pentru conectarea diferitelor structuri de
cip-uri.
In special last level cache (LLC) este distribuit intre nucleele CPU-ului si placa grafica, ceea ce elimina si transferul de date dintre respectivele unitati. Designul SoC-ului are numeroasele domenii ale ceasului impartite intre nucleul CPU-ului, ceasul procesorului grafic si domeniile ceasurilor inelului de interconectare.
Caracteristicile motorului grafic suporta randare pe baza de tile in adaosul randarii modului imediat, ceea ce ajuta la reducerea cererilor de memorie in timpul unor randari ale sarcinilor de lucru.
Aici observam o privire de ansamblu asupra ierarhiei memoriei si varfurilor de largime de banda asociate teoretic intre componente. Intel intentioneaza sa sustina ca LPDDR4 reprezinta un pas semnificativ inainte in largime de banda pe fata cu putere redusa, dar adevarata inovatie consta in designul memoriei distribuite ce reduce nevoia de a copia datele intre zonele de buffer.
GTI-ul (Graphics Technology Interface - Interfata tehnologica grafica) conecteaza GPU-ul la restul SoC, la fel ca memoria LLC si DRAM, iar Intel a imbunatatit performanta de la 32B/clock la 64B/clock pentru operatiile de scriere, concomitent cu rafinarea sirurilor de asteptare pentru a imbunatati latenta si largimea de banda. Aici putem vedea ca GPU-ul poate citi si scrie in inel la 64B/clock, in timp ce CPU-ul poate citi si scrie la 32B/clock, asta insemnand ca GPU-ul are o cale mai
rapida la cache-ul last level L3. In plus, GPU-ul are propriul cache intern L3 de 3MB care este un intermediar intre subslice-uri si GTI.
Fiecare slice gazduieste funcția de geometrie fixa 3D, 8 sub-slice-uri continand EU-uri, si un ”slice common” care contine diferite blocuri de functii fixe si scrie in
cache-ul L3 al slice-urilor. Intel a imbunatatit subsistemul memoriei de patru ori la cache-ul L3 de 3MB si a separat memoria locala pentru a promova paralelismul. Noul design imbunatateste si algoritmii de compresie a memoriei.
Citeste si articolul: Grafica integrata AMD versus Intel: Nu putem merge mai repede?
Specialistii de la DepanareCalculatoare.Net iti pot oferi la solicitarea upgrade pentru placa ta grafica integrata cu o placa de baza bazata pe arhitectura grafica pentru Gen11, prin inlocuire prin montaj. De asemenea iti putem oferi si suport in alegerea unei placi de baza performante bazata pe arhitectura Gen11. Pe langa aceste servicii, separat, venim cu servicii de depanare calculatoare la domiciliul tau in Bucuresti si Ilfov.
Alte imbunatatiri includ un motor nou HEVC Quick Sync Video care dispune pana la 30% reducere fata de Gen9 (la aceeasi sau la o mai buna calitate vizuala), suport pentru fluxuri video multiple de 4K sau 8K intr-o modulatie de putere mai mica, si suport pentru tehnologia Adaptive Sync. Decodarea adancimii de bit VP9 este imbunatatita până la 10 biti (de la 8) pentru a suporta HDR video.
Privind in adancime in interiorul unui slice, putem vedea ca fiecare slice gazduieste opt subslice-uri, fiecare cu opt EU-uri. Fiecare subslice gazduieste o unitate local thread dispatcher cu propriile instructiuni. O memorie locala distribuita (SLM), o unitate de esantionare a texturii 3D, o unitate de esantionare pentru media, si o unitate dataport pentru a completa fiecare subslice.
Focalizand microscopul mai adanc in unitatea de executie multi-thread (EU), putem observa o pereche de unitati SIMD in virgula mobila (ALU), insa aceste unitati suporta
defapt operatiuni in virgula mobila cat si operatiuni cu intregi. Intel precizeaza ca unitatile ALU sunt capabile sa execute patru 32-biti FP sau operatiuni cu intregi, sau pana la opt operatiuni de 16-biti. Asta echivaleaza cu operatiuni 16 FP32 / clock, sau operatiuni 32 FP16 / clock.
O privire mai atenta asupra designului memoriei locale partajate (SLM - Shared Local Memory), care alimenteaza opt EU-uri in fiecare subslice, arata ca Intel a transformat SLM-ul in subslice pentru a reduce disputa prin intermediul dataport-ului cand cache-ul L3 este in curs de accesare simultana. Proximitatea apropiata a SLM-ului fata de EU ajuta de asemenea la reducerea latentei si imbunatateste eficienta.
Daca vrei sa afli cum sa iti faci singur upgrade-ul la noile procesoare grafice Gen11 poti urmări si tutorialele noastre de pe blogul de stiri it ce nu vor intarzia sa apara.
Comentarii
Trimiteți un comentariu