Twoje PC  
Zarejestruj się na Twoje PC
TwojePC.pl | PC | Komputery, nowe technologie, recenzje, testy
M E N U
  0
 » Nowości
0
 » Archiwum
0
 » Recenzje / Testy
0
 » Board
0
 » Rejestracja
0
0
 
Szukaj @ TwojePC
 

w Newsach i na Boardzie
 
TwojePC.pl © 2001 - 2019
Wtorek 11 czerwca 2019 
    

Rzut oka na wewnętrzną budowę GPU Navi


Autor: Wedelek | 19:37
(7)
Premiera Radeonów RX 5700 i RX 5700XT to świetna okazja by bliżej przyjrzeć się wewnętrznej budowie GPU Navi i zmianom jakie zaszły względem Vegi. Na wstępie zaznaczam, że wbrew pozorom najnowsze Radeony nie korzystają w pełni z architektury RDNA, a Navi to tak naprawdę hybryda RDNA i czwartej wersji GCN. Skoro to mamy już wyjaśnione, to przejdźmy do budowy pełnego GPU, które możemy znaleźć w modelu RX 5700XT. Już na samym początku rzuca się w oczy całkowicie przemodelowany blok CU (Compute Unit), który jednak nadal budują 64 procesory strumieniowe. Łącznie, przy 40 blokach CU daje nam to 2560 procesorów strumieniowych, a więc wyraźnie mniej niż w Vedze 64, gdzie było 4096SP (64CU).

Jak można się było spodziewać mniejsza ilość jednostek oznacza o wiele niższą wydajność w obliczeniach, ale nie w grach. Dzieje się tak dlatego, że AMD inaczej rozplanowało ułożenie poszczególnych elementów i mimo pozornych podobieństw (taka sama ilość SP) bloki CU w Vedze oraz Navi bardzo się od siebie różnią. Przykładowo miejsce jednego, wspólnego planisty i jednostki skalarnej zajęły dwa takie elementy, ale kosztem inaczej zrealizowanych rejestrów. Ponadto pojawiła się nowa, współdzielona pamięć pierwszego poziomu o pojemności 512KB. Zapewnia ona dwukrotnie wyższą przepustowość niż pamięć L2, której jest 4MB, a przy tym opóźnienia w dostępie do danych są mniejsze o 21%. To znacznie poprawia szybkość komunikacji jednostek arytmetyczno logicznych z cache. Poprawki na tym polu objęły zresztą nie tylko pamięć L1, ale i L2 oraz L0.

Wreszcie AMD inaczej podeszło do kwestii obliczeń dokonywanych na zadanych danych. Miejsce czterech jednostek SIMD16 podłączonych do jednego planisty zajęły dwa SIMD32 z własnymi planistami. Co ciekawe jak by nie patrzeć jest to krok wstecz, bo rozwiązanie zastosowane w RDNA jest tak naprawdę mniej efektywne od tego znanego z GCN. Jeden blok w Vedze mógł bowiem wykonać maksymalnie obliczenia na szesnastu elementach, co zajmowało cztery cykle zegarowe, a RDNA może wykonać zaledwie połowę takich obliczeń, choć na większej partii informacji. Przewaga nowej architektury wynika jednak z szybkości przetwarzania prostych instrukcji. Okazuje się, że każdy SIMD32 może przetworzyć jedną instrukcję na cykl zegarowy, a to oznacza, że dane dostaniemy cztery razy szybciej niż w przypadku GCN.

W skomplikowanych obliczeniach stara architektura jest więc wydajniejsza, ale w grach operujących na prostych obliczeniach, gdzie trudno wykorzystać na raz wszystkie jednostki to RDNA pokazuje przysłowiowy pazur.

Przewaga RDNA drzemie również w znacznie usprawnionym algorytmie kompresji koloru, który jest nie tylko wydajniejszy, ale też umożliwia podprogramom (shaderom) szybkie zapisywanie i odczytywanie wartości bezpośrednio do/z rejestru. Nie trzeba więc już tracić czasu na żmudne kompresowanie i dekompresowanie danych.

Wszystkie te usprawnienia sprawiają, że w grach wydajność pojedynczego bloku CU jest o 25% wyższa w porównaniu do GCN, a po dodaniu do tego wyższych zegarów i niższych opóźnień wynikających z litografii 7nm możemy mówić o 50% poprawie.


Kliknij w obrazek aby go powiększyć – szkoda marnować wzrok 😊



 

    
K O M E N T A R Z E
    

  1. mnie ciekawi jaka będzie wydajność (autor: Mario2k | data: 11/06/19 | godz.: 23:46)
    W kopaniu Ethereum ewentualnie innych krypto.

  2. @ Mario2k (autor: power | data: 12/06/19 | godz.: 00:40)
    Duzej roznicy nie bedzie.
    Na plus jest wysokie taktowanie pamieci GDDR6 i usprawnienia w architekturze GPU (o 1.25x wieksza wydajnosc nowych rozbudowanych jednostek i o 1.5x wieksza wydajnosc na Wat).
    Na minus jest mniejsza liczba jednostek wykonawczych.


  3. @temat. (autor: Mariosti | data: 12/06/19 | godz.: 01:15)
    Jak pamiętam z początków obecnej architektury nvidii, czyli zasadniczo z fermii, to właśnie takie podejście z mniejszymi wave'ami ale 2x per CU i osobnymi schedulerami to jest dokładnie to z czego korzysta nvidia, a to co do tej pory miało amd to jakby zaszłość z VLIV4.

    To może być autentycznie krok w bardzo dobrym kierunku.


  4. czyli AMD wycofuje się z dobrodziejstwa inwentaża dodanego przez Maharadżę, (autor: Qjanusz | data: 12/06/19 | godz.: 09:14)
    usprawniając wcześniejsze podejście i wyciągając z tego obiecujące prognozy. Zobaczymy jak to wyjdzie poza prezentacjami.


  5. hmmm (autor: mlc | data: 12/06/19 | godz.: 11:09)
    niby jest trochę zmian, do tego 7nm, a de facto i tak te karty wypadają blado przy nVidii, niestety.

  6. Mnie interesuje czy ta Navi , która zaraz się pojawi (autor: Mario1978 | data: 12/06/19 | godz.: 11:14)
    będą jednocześnie hybrydą co także zakładałem , że będzie prognozując dodanie do GCN coś takiego jak superSIMD jest w pełni dalej dzieckiem Pana Koduriego czy jednak mamy tutaj do czynienia dodatkową ingerencję w kod genetyczny tej archi po odejściu tego pana do Intela.
    AMD z tego wynika nazywając to Hybrydą nie chce ujawniać wszystkich zmian jakie tu zaszły i zobaczymy je dopiero w pełnej wersji Navi na przyszły rok.
    Czyli nie spodziewam się niczego innego jak dodatkowego wzrostu IPC w przyszłorocznej Navi , która będzie miał wsparcie także dla wyspecjalizowanych obliczeń i będzie tak na prawdę pierwszą generacją nowej archi nazwaną RDNA gen.2.


  7. ... (autor: MBR[PL] | data: 12/06/19 | godz.: 12:55)
    Czyli powtórka z wprowadzenia GCN. W GCN 1.0 w 2012 wprowadzono sporo nowości (więcej niż teraz w Navi) ale architekturę w pełni dojrzałą ujrzeliśmy dopiero w GCN 1.1 rok później (pełna obsługa DX12, AMD FreeSync itp)

    
D O D A J   K O M E N T A R Z
    

Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.