HD 7990, czyli nowy potwór AMD w liczbach

M E N U

» Nowości

» Archiwum

» Recenzje / Testy

» Board

» Rejestracja

Szukaj @ TwojePC

Poniedziałek 28 marca 2011

HD 7990, czyli nowy potwór AMD w liczbach Autor: Wedelek \| źródło: overclock.net \| 07:21	(95)
Jeszcze nie opadł kurz bitewny po starciu dwóch najwydajniejszych układów Nvidia i AMD, a do sieci wyciekła już informacja na temat prawdopodobnie najwydajniejszego przedstawiciela kolejnej generacji kart firmy z Sunnyvale. Mowa o akceleratorze który ma się zwać Radeon HD 7990, będzie produkowany w 28nm procesie produkcji i będzie prawdopodobnie konstrukcją dwuprocesorową. Oczywiście prezentowana tutaj specyfikacja techniczna jest nieoficjalna i w momencie premiery może się różnić od tej prezentowanej dziś. A trzeba przyznać że nowa karta prezentuje się bardzo ciekawie. Jeśli wierzyć przeciekom mamy bowiem do czynienia z 6400 procesorami strumieniowymi, 256 jednostkami teksturującymi i 96 rasteryzującymi oraz aż 6GB pamięci RAM typu GDDR5+ połączonych interfejsem 384-bitowym. Przepustowość pamięci tego "potwora" wyniesie bagatela 576 GB/s, a wydajność karty w przypadku pojedynczej precyzji wyniesie 12,16 TFLOPS oraz 3,04 TFLOPS dla podwójnej, czyli ponad dwukrotnie więcej niż w przypadku Radeona HD 6990. Ciekawie prezentuje się również pobór prądu, który będzie niższy niż w obecnej generacji akceleratorów i wyniesie odpowiednio 300W przy obciążeniu i 30W w spoczynku. Model HD 7990 będzie również korzystać z niedawno opublikowanej specyfikacji magistrali PCI-Express 3.0.

K O M E N T A R Z E

... (autor: Mariusch1 | data: 28/03/11 | godz.: 07:40)
Wątpię by były to rzeczywiste informacje na temat następcy HD6990 szczególnie, że HD6990 dopiero co miał premierę. Więc wychodziło by na to że mają już gotowe układy co jest bardzo wątpliwe.
@wedele (autor: Gniew | data: 28/03/11 | godz.: 07:41)
a nic nie wspominali kiedy maja to wypuscic ??
Skoro (autor: Irmo | data: 28/03/11 | godz.: 07:43)
HD6990 nie powtórzył zwycięstwa HD5990 nad konkurencją trzeba uderzyć mocnym papierem.
@Gniew (autor: Wedelek | data: 28/03/11 | godz.: 08:00)
Nie, nie wspominali, ale jest jeszcze na takie rzeczy za wcześnie. Ogólnie rzecz biorąc są to przecieki i jak zawsze w przypadku tak odległej premiery trzeba podchodzić do nich z należytym dystansem.
Irmo (autor: agnus | data: 28/03/11 | godz.: 08:15)
A mnie sie wydawało że to GTX nie zdetronizował 6990? :D
... (autor: Deathraw | data: 28/03/11 | godz.: 08:18)
To wygląda jak cuda na kiju-dużo większa wydajność i mniejszy pobór prądu.Tak notabene na co by było komu 6gb na karcie?
@Agnus (autor: Irmo | data: 28/03/11 | godz.: 08:33)
W niższych rozdzielczościach lepszy GTX w wyższych 6990, z drugiej strony kto kupuje takie karty do rozdzielczości 1680x1050 :E
@Deathraw (autor: Promilus | data: 28/03/11 | godz.: 09:03)
Bo przez ten kontroler jeden chip może wziąć na klatę albo 1,5GB albo 3GB, a jak po GTX590 widać 1,5 to za mało.
realne ale dopiero za minimum rok czasu (autor: Mario2k | data: 28/03/11 | godz.: 09:23)
Zanim takie monstrum wejdzie do sprzedazy musza wypuscic modele z jednym GPU.
b.t.w

na kiedy amd zapowiada nastepce radka 6979 ?
@temat (autor: Mariosti | data: 28/03/11 | godz.: 09:39)
Proces 32nm miał tutaj już być do tej pory więc można się domyślać że pracowali nad podobną konfiguracją gpu już od ponad roku. Co do spadku zużycia energii to jest to w zupełności możliwe... w końcu przejście z 40 na 28nm to skok aż o 1.5node'a.
tja (autor: acd | data: 28/03/11 | godz.: 09:42)
pozyjemy zobaczymy
To jest jak najbardziej realne info. (autor: Wujofefer | data: 28/03/11 | godz.: 09:48)
Wystarczy zobaczyć jaka różnica jest między 55nm Radeonem 4870 a 40nm Radeonem 5870. Podwoili liczbę procesorów strumieniowych, TMU i ROP, zwiększyli transfer danych między GPU a pamięcią o jedną trzecią.
Pojedynczy 5870 miał niewiele mniejsza wydajność niż dwu układowy potwór 4870x2.
Liczby które tutaj mamy odnoszące się do 7990 wystarczy podzielić przez dwa i mamy Radeona 7970. No może zużycie prądu będzie trochę większe niż te 150W bo układy z dwoma GPU zawsze mają trochę zaniżone taktowanie.
niech lepiej buldożulki pokażą (autor: Sony Vaio rev 2.0 | data: 28/03/11 | godz.: 09:53)
a nie zasłonę dymną
AMD przgrało w ostatnich testach (autor: pomidor | data: 28/03/11 | godz.: 10:02)
z GF 590, i już się odgraża następną generacją :)
@13 i @14 (autor: popierdulka1234 | data: 28/03/11 | godz.: 10:27)
tak, tak, wiemy że GRILLFORCE jest THE BEST OF THE BEST w GRILL COMPETITION

w sumie firma SPARKLE, może spokojnie swoje modele nazywać SPARKLEFORCE :)
Nalezaloby spekule (autor: morgi | data: 28/03/11 | godz.: 10:35)
rozpoczac od Nvidii, ktora tradycyjnie ma najszybsze, najwydajniesze i najlepiej wyposazone w technologie i innowacje gpu na rynku. Firemkowy sort jest to zawsze jakis kompromis i niestety czesto za przesadzona cene.
@16 (autor: popierdulka1234 | data: 28/03/11 | godz.: 10:42)
w sumie jaranie elektroniki za 2700PLN w GTX590 fajna sprawa nie,

bida że na ATI się to nie udaję, jestem wprost zawiedziony z tego powodu
@pomidor (autor: Promilus | data: 28/03/11 | godz.: 10:51)
Chyba słońce wiosenne tak mocno nie grzeje... więc co? Za blisko 590 stałeś? :>
a moim zdaniem fake (autor: MateushGurdi | data: 28/03/11 | godz.: 10:56)
W architekturze VLIW4 ciezko byloby uzyskac 6400 procesorow strumieniowych. Zreszta pamietam jeszcze plotki o serii HD5xxx, rdzenie master i rdzenie slave, heh bylo smiesznie w trakcie premiery ^^
MateushGurdi (autor: morgi | data: 28/03/11 | godz.: 11:03)
Przeciez to dualik domniemany, liczby jak liczby szkoda, ze te vliw zachowuja sie w rzeczywistosci jakby wiekszosc byla bez pradu.
Świat marketingu AMD. (autor: mFuker | data: 28/03/11 | godz.: 11:09)
Jak kiedyś trzymali fason i jako jedyni trzymali się przyzwoitych faktów i nie mącili kijem wody, tak teraz mnogość nic nie wartych niusów od nich przyprawia o niesmak.
MateushGurdi (autor: Aamitoza | data: 28/03/11 | godz.: 11:35)
Ta... skoro jeden SIMD ma 64 procesory, a 6400 tyczy się karty 2 procesorowej, to 6400/2= 3200, a 3200/64=50 SIMD. Obecnie HD6870 ma 24 SIMD. Więc we wliv 4 będzie to 640SPU (w miejsce obecnych 384SPU).

Sama konfiguracja wydaje się być bardzo realna, a układ powinien być mniejszy od HD6970.
Aamitoza (autor: morgi | data: 28/03/11 | godz.: 11:51)
taaa, mniejszy jak doloza szyne, wiekszosci jednostek, enginow, cachow jeszcze podejma probe naprawy teselacji i gpgpu, wiadomo, ze wszystko zalezy od mozliwosci tsmc, ale to Nvidii udalo sie nieco zmniejszy Fermi niz wczesniejszy chip, ale i tak to bylo i jest ogromny trud dla fabu.
@morgi (autor: Promilus | data: 28/03/11 | godz.: 11:58)
Jak zwykle pieprzysz od rzeczy
@morgi (autor: pebal | data: 28/03/11 | godz.: 12:48)
Przestań bredzić i sam się napraw.
a ktos sie orientuje (autor: zigg | data: 28/03/11 | godz.: 12:52)
czy mozna spodziewac sie odswiezenia obecnej architektury w mniejszym procesie produkcyjnym ?
@26 (autor: popierdulka1234 | data: 28/03/11 | godz.: 13:39)
ja nie miałbym nic przeciwko takiemu obrotowi

zieloni na bank tak zrobią, bo w 40nm to toną
czy odpoczniemy od morgiego (autor: Michał_72 | data: 28/03/11 | godz.: 15:00)
pomidorów i innych buraków?, czy też jedynym sposobem jest wycięcie "twojepc.pl" z zakładek?

Pytam serio PT Redakcję.
@aamitoza (autor: MateushGurdi | data: 28/03/11 | godz.: 15:13)
zaczne tak jak ty - Ta... bardzo rzeczowe nie powiem, jak nie raczyles zauwazyc to w elektronice uzywa sie najczesciej wielokrotnosci poteg dwojki, aktualne Radki maja 24 SIMDy wiec daje to 12 na rdzen (2^3+2^2) wiec jesli zwieksza dwukrotnie to bedzie 24 na rdzen (2^4+2^3), gdyby bylo Twoja metoda to na kazdy rdzen musieli by dodac jeden blok SIMD co w elektronice nie jest rzecza porzadana. Chyba ze kastrowaliby chipy ale w to watpie. Co wiecej to chyba nie zauwazyles swoja droga ze seria HD6xxx uzywa architektury VLIW4, nie wiem co ma znaczyc to cos "Więc we wliv 4 będzie to 640SPU (w miejsce obecnych 384SPU)."
MateushGurdi (autor: Aamitoza | data: 28/03/11 | godz.: 15:25)
Chyba czegoś nie rozumiesz. Obecnie masz w każdym SPU 4 rdzenie (VLIV4), jeden simd składa się z 16SPU - co daje nam 64 rdzenie na SIMD, a skoro cayman ma 24SIMD, to tym samym 384SPU i 1536procesorów. Tutaj wszystko się jak najbardziej zgadza czemu usilnie starasz się zaprzeczyć i piszesz o dodawaniu jakiś pojedynczych SIMD.

Co ma do tego wszystkiego dwójka?

Cypress miał 5procesorów na SPU (VLIW5) i na jeden SIMD składało się jak teraz 16SPU, więc 80 procesorów. Cypress miał 20SIMD, RV770 miał 10SIMD, a taki R600 miał tylko 3SIMD.

W newsie jest informacja o układzie z 100SIMD. Ja analizuję dane dla układu jednordzeniowego czyli dla 50SIMD.
Michal (autor: morgi | data: 28/03/11 | godz.: 16:01)
Odpoczniesz w swoim czasie, a ja deklaruje, ze bede pisal fakty i demontowal mity, czyli kolejny fakt firemka to hamulcowy rynku gier, ostatnio jeden spec od nich ukierunkowal tory rozwoju na pozbycie sie api, szaleniec z brzytwa, jak nie maja swojego api to mysla ze wszyscy powinni za nich to robic...
Aamitoza (autor: morgi | data: 28/03/11 | godz.: 16:06)
Demontaz mitu, firemkowe produkty hd5k i hd6k maja 320 i 384 procesory od obliczen, a te ich mnozniki i nazewnictwo to pusty marketing fizycznie maja mniej, ale moga liczyc wektorami czasem szybciej niz skalarami.
@morginalny (autor: rainy | data: 28/03/11 | godz.: 16:26)
Morguś, biedactwo ty nasze, z twoją główeńką jest coraz gorzej (zapewne nigdy nie było zresztą dobrze).

Jak firemka może być hamulcowym rynku gier(?) - to sama w sobie sprzeczność logiczna.
Sorki (autor: scoobydoo19911 | data: 28/03/11 | godz.: 16:27)
ALe nie ma się co napinać narazie.
Na chwilę obecną to czyste spekulacje są.
Poczekajmy do premiery nowego radka i jego ewentualnego konkurenta.
scoobydoo19911 (autor: pomidor | data: 28/03/11 | godz.: 16:44)
Przecież niedawno była premiera nowych kart: Bartsy, Kajmany, Antilesy, Fermi w różnych smakach. Niestety większość troli AMD siedzi na wieloletnich integrach, i żyje od premiery do premiery, w międzyczasie zalewając jazgotem trolowym.
... (autor: Aamitoza | data: 28/03/11 | godz.: 16:44)
Jedyny hamulcowy na rynku gier, to nvidia ze swoim zamkniętym physixem. Nie wspomnę kto tutaj głównie wspiera gry DX11 - bo jak na razie większość takich produkcji (poza metro) ma logo AMD.

Total war shogun 2? Logo AMD i DX11, Dragon Age 2? to samo, a poza tym jeszcze: Battlefield Bad Company2, F1 2010, Medal of Honor, Lord of the rings, Civilization V, Stalker: zew prypeci, Alien vs Predator, Colin McRae Dirt2?

Wszystko ma DX11 jak i logo AMD Gaming Evolved.

Ile produkcji z DX11 ma nvidia? Metro i wspólne z powyższej listy civilization 5 i battlefield BC2.

więc 10:3 - fajnie, fanie ;)
... (autor: Aamitoza | data: 28/03/11 | godz.: 16:51)
Zapomniałem jeszcze o H.A.W.X 2 - więc 10:4.
@morgi (autor: Promilus | data: 28/03/11 | godz.: 17:12)
Żresz marketingową papkę i srasz marketingową papką. Nic dziwnego że gówno wiesz.
ta specyfikacja to fejk! (autor: Gigant | data: 28/03/11 | godz.: 17:21)
konfiguracja 3200SP/128TMU się kupy nie trzyma bo 3200SP to 50 SIMDów a AMD do każdego silnika simd podczepia zawsze po 4/8TMU. 50x4TMU=200TMU. Układ powinien mieć conajmniej 200TMU przy takiej liczbie procesorów strumieniowych.
Amitoza (autor: scoobydoo19911 | data: 28/03/11 | godz.: 17:40)
Fakt psyhx jest zamkniety i jest nie fajna cecha ale system ten wogóle istnije i od czasu do czasu pokazuje sie w grach a konkurencyjny system fizyki liczonej na gpu jeżeli istnieje to jest jeszcze w powijakach. a dx11 dla mnie to narazie pieśń przyszłości. dopóki aktualne konsole dobrze się mają nie musze mojego gtx260 wymieniać.
morgi (autor: Gigant | data: 28/03/11 | godz.: 17:49)
Fermi ma 512 procesorów 32bit a Cayman to 384 procesory 128bit(vliw4). Architektonicznie AMD jest 100 lat przed Nvidią ;)

AMD: 1GHz*384procesory*128bit= 49,152
Nvidia: 2GHz*512procesory*32bit= 32,768

Nvidia ma puste megaherce. ;)
scoobydoo19911 (autor: Aamitoza | data: 28/03/11 | godz.: 18:01)
"Fakt psyhx jest zamkniety i jest nie fajna cecha ale system ten wogóle istnije i od czasu do czasu pokazuje sie w grach a konkurencyjny system fizyki liczonej na gpu jeżeli istnieje to jest jeszcze w powijakach. a dx11 dla mnie to narazie pieśń przyszłości."

Fakt jest taki, że gier DX11 jest już więcej niż gier z physix GPU (a ten jest na rynku kilka razy dłużej). Tylko nie pisz, że nie widać tego DX11, bo w tych grach z physix tej zaawansowanej fizyki też za bardzo nie widać. (poza kilkoma wyjątkami - podobnie z DX11).
może i (autor: scoobydoo19911 | data: 28/03/11 | godz.: 18:31)
go widać ale rowlucji jak przy wprowadzeniu shaderów do pc czy wprowadzeniu dx9 nie ma.

I czemu cytując moją wypowiedź nie użyłeś całości? W takie wycinanie z kontekstu to ja też moge się bawić.
... (autor: Aamitoza | data: 28/03/11 | godz.: 18:40)
A co miał do physixa Twój GTX260 i konsole? DX11 jak i physX GPU są dostępne tylko na PC i są dodatkowymi efektami. Wyciąłem tylko fragment który tyczył się physixa i DX11.

odnośnie "konkurencyjnego" systemu fizyki, to takowego nie ma - jest tylko bullet który działa i na kartach nvidia i na amd. No jednak ciężko żeby nie był w powijakach na tle silnika który na rynku jest już ponad 6 lat, a wsparcie GPU ma od ponad 3.
rainy (autor: morgi | data: 28/03/11 | godz.: 18:47)
Firemka nie wspiera i nie ma nowinek w stylu fizyki, malo tego odstrasza, twierdzac, ze fizyka nie ma wiekszej sily przebicia, a sami nie maja alternatywy nie wprowadza nawet godnego dx11 z teselacja i bezproblemowa jakoscia tekstur, sami sa kiepskimi patenciarzami i kastratami panicznie tnacymi rozwoj. psiks jaki jest to jest, ale ma multiplatformowe rozwiazanie, wprowadzane sa gry ze wsparciem i do tego jest mozliwosc odpalenia na cpu, wszystko to proponuja inne api fizyki, ale sa duzo bardziej zawezone lub pozostaja na uzyciu cpu jak Havok. Inne rozwiazania techniczne jak eye.... to nieporozumienie, probuja z tego wybrnac na stereo 3d, ale to juz ma Nvidia, innych propozycji nie znam, inne musza przyjsc z czasem jak polataja architekture, albo zmienia ja lub specyfikacje urzeczywistnia.
gigant
Jakos w procesorach rdzenie da sie uzywac w prostym przelozeniu, kogo obchodzi ilosc alu/fpu na rdzen na chip, tak tutaj powinno byc jasne, fizyczny procesor obliczajacy i tyle. Potem tylko szok jak mozliwe, ze 3x tyle maja i podloge zamiataja..
a to (autor: scoobydoo19911 | data: 28/03/11 | godz.: 18:48)
ma że dzięki aktualnym konsolom grafika stoi w miejscu a większość gier pc to porty więc nie musze wymieniać karty graficznej. Jakbyś uwaznie przeczytał to byś wiedział o co chodzi. W mojej pierwsze wypowiedzi było wyraźnie napisane że dx11 jeśt pieśnią przyszłości "dla mnie" a nie dla wszystkich. Reasumując przynajmniej do następnej generacji kart(bądź premiery nowych konsol) nie zobaczymy pełni możliwości dx11.
... (autor: Aamitoza | data: 28/03/11 | godz.: 18:52)
Morgi, a w innym wypadku szok, jak HD5770 za 400zł z 160SPU łamie szybciej hasła od GTX580 za 4x tyle z 3,5x większą ilością rdzeni.
scoobydoo19911 (autor: Aamitoza | data: 28/03/11 | godz.: 18:57)
Tak jak nie zobaczymy pełni fizyxa, bo wszystko implementowane w grach to APEX - czyli łatwe i szybkie do implementacji elementy w gotowej grze - czyli powstaje coś na konsole z podstawowym physixem, nvidia sypie kaską, a programiści wrzucają apexa. A gry z zaawansowaną fizyką która ma wpływ na świat gry i na grę zobaczymy dopiero jak silnik fizyki będzie działać na wszystkich kartach graficznych i GPU w konsolach - więc bardziej prawdopodobne, że będzie to bullet, a nie physix.
@morgi (autor: Promilus | data: 28/03/11 | godz.: 19:06)
To ile rdzeni cuda w GTX580 potrafi liczyć sinusa? A ile w GT200 potrafi liczyć FP64? To jest wg ciebie ten jasny i prosty system nazewnictwa? Gdzie nie wiadomo jakie jednostki są od czego i ile ich jest. Jesteś zapyziałym hipokrytą i tyle.
ale (autor: scoobydoo19911 | data: 28/03/11 | godz.: 19:10)
czy ja napisałemże widzieliśmy gdzieś pełnie psyhx?
Gdyby w jakiejś grze coś takiego odtworzyli to współczesne gpu raczej rady by nie dały.
Co do silników to mnie mało obchodzi czy to będzie bullet czy psyhx ważne żeby szybko to działało i ładnie wyglądało a przy dzisiejszej mocy gpu jest raczej nie realne
scoobydoo19911 (autor: Aamitoza | data: 28/03/11 | godz.: 19:13)
może i nie jest realne, ale jest zdecydowanie realne to, aby physix wyglądał jak by miał wpływ na rozgrywkę, a nie był wrzucony na siłę, bo obecnie w 95% produkcji z physx GPU wygląda to tak jak by znalazło się w grze na siłę.
@morginalny (autor: rainy | data: 28/03/11 | godz.: 19:29)
Rzeczywiście coraz słabiej kojarzysz, trzeba ci wszystko wyjaśniać lopatologicznie.

Firemka (czytaj mała firma), która z racji swej wielkości nie może mieć wpływu na rynek (jakikolwiek).
Zaś hamulcowy, to jednak firma mająca spory wpływ/udział na to co się dzieje na rynku.

Te dwa określenia połączone razem są sprzeczne logicznie - tertium non datur.
równie (autor: scoobydoo19911 | data: 28/03/11 | godz.: 19:30)
dobrze można to samo napisać o dx11 czy dx10.jedyne co dały we wspólczesnych grach to ładniejsze dymki, mgły i inne pierdoły a w przypadku dx11 średnio wydajną tesselację.
@Aamitoza (autor: MateushGurdi | data: 28/03/11 | godz.: 20:22)
Chodzi o to ze we VLIW4 nie zrobia 6400 procesorow strumieniowych tylko jak juz to 6144, 6400 byloby we VLIW5, Zreszta 6400 mial miec HD6990, a tu myk, nowa architektura, ta wyglada jak przeliczana dla VLIW5, to mi wlasnie nie pasuje.
@morgi
przyjmij do informacji ze AMD stosuje inna architekture niz nvidia bo widze ze cos nie idzie Ci przyswajanie
olala (autor: cyferluu | data: 28/03/11 | godz.: 20:24)
proste pytanie na które ni epadnie prosta odpowiedz :D

morgi.
Skoro AMD ma taka do dupy architekturę dlaczego ilosc generowanych klatek na ekranie jest nieżadko większa niz proponuję konkurencja ze swoją genialną ( zapewne twoim zdaniem) architekturą Fermi ( to jest dopiero FAIL i tu trzeba zmieniać , bo ciągle jakieś nowe problemy)

wiem ze napiszesz ,że jest zupełnie inaczej. tylko spójrz ile osób przyzna ci racje?
@cyferluu (autor: Promilus | data: 28/03/11 | godz.: 20:30)
Przecież morgi jedzie na P4 z i845G więc jak on może cokolwiek wiedzieć o grafice ;)
... (autor: Aamitoza | data: 28/03/11 | godz.: 20:36)
Co Ty pierdzielisz? jak nie zrobią? Ilość SIMD jest bez znaczenia. byle była parzysta, bo obecnie na jednym GPU masz 2 graphics engine i dzielą się po połowie SIMD. A 50SIMD jest parzyste i wychodzi 25SIMD na graphics engine.

Co Tobie wygląda? We VLIV4 jest 64procesory na SIMD (16SPU po 4 procesory)... a teraz policz * 50SIMD *2GPU. Co Ci wychodzi? 6400procesorów.

Przy VLIW5 wyszło by też - 40SIMD. Tylko, że wtedy był by to podwojony cypress, a w nowych układach mamy VLIW4.

Podwajanie SIMD wcale nie jest konieczne - w przypadku R600 miałeś 3SIMD, a w RV770 już 10, a nie 2x więcej czyli 6. cypress byłpodwojonym RV770, a cayman na 24SIMD. Jak to podwoisz będzie 48SIMD + 2 (wszystko pasuje, bo graphics procesor nie musi mieć parzystej liczby SIMD, co widać po R600 jak i HD6950 który ma aktywne 11SIMD na graphics procesor).

Inna sprawa, że ilość TMU w tej specyfikacji się nie zgadza ani dla VLIW4 ani dla VLIW5. Dla VLIW5 powinno być 160TMU, a we VLIW4 200. 128 było by możliwe tylko wtedy kiedy mieli byśmy 32SIMD czyli 2048procesorów.
A może (autor: scoobydoo19911 | data: 28/03/11 | godz.: 20:45)
to nie jest ani vliw4 ani 5 tylko jakiś zupełnie nowy rodzaj ?
Aamitoza (autor: morgi | data: 28/03/11 | godz.: 20:55)
Nie lamie, gpu nie nadaja sie do tego, jeden lewy ruski benchmark za nic nie odpowiada, w jaki sposob liczydlo Nvidii moze byc szybsze i potrafi liczyc rozne rzeczy, odpowiedz jest jedna CUDAcznosc w ktora pakuja gros inwestycje, nie kojarze nic od firemki, byc moze tylko jakas nieudolny zestaw narzedziowy, nad ktorym pracuja generatorzy demek.hehe
MateushGurdi (autor: morgi | data: 28/03/11 | godz.: 21:01)
Co mnie lipna architektura, prosty przekaz co widac na skanie chipa a co na komiksach marketerow juz mnie dziwi, skoro maja te czterocyfrowe wartosci, to jakim cudem Nvidia z polowa z tysiaca loi ich smiertelnie i nie mow mi o taktowaniach, bo chip Nvidii ma i tak nizsze dla calego klastra.
Promilus (autor: Gigant | data: 28/03/11 | godz.: 21:04)
Dużo osób jedzie na integrach, karty graficzne kupują tylko gracze. Ja np. teraz jade na itegrze 780G do netu filmów wsam raz. ;)
morgi (autor: scoobydoo19911 | data: 28/03/11 | godz.: 21:11)
obie firmy mają różne podejście do projektowania gpu. się na amych kwestiach technicznych sie zbytnio nie znam ale wiem że jeżeli coś spełnia swoje zadanie to nie potrzeba się zagłebiać w szczegóły
@Gigant (autor: Promilus | data: 28/03/11 | godz.: 21:16)
Tylko twoja integra pociągnie i FF4, a i845 nawet na 3dmark 2001 się zacina :P
@morgi - compute4cash albo bitcoin i AMD wymiata konkurencję więc daruj sobie uszczypliwości. Chciałeś zabłysnąć a wyszło jak zwykle...
morgi (autor: Gigant | data: 28/03/11 | godz.: 21:28)
Bo AMD tak naprawdę nie ma 1536 procesorów tylko są to jest marketing. ;)Procesorów w Caymanie jest 384 vliw4 (128bit)
Jakby (autor: Gigant | data: 28/03/11 | godz.: 21:33)
AMD miało 1536 procesorów vliw4 to by zmiażdżyło Fermiego ze 3 krotnie.
Promilus (autor: Gigant | data: 28/03/11 | godz.: 21:37)
morgi jedzie na i845? no to niezaciekawie.... ;)
@Gigant (autor: Promilus | data: 28/03/11 | godz.: 21:43)
Nie wiem na czym jedzie, ale biorąc pod uwagę jego kompleksy to i845G to chyba szczyt jego możliwości. Nie widziałem jeszcze człowieka który nawet nie spróbował skompilować hello world, a miał tyle do powiedzenia na temat GPGPU czy generowania obrazu ;)
no dobra, takty, srakty, morgi (autor: franc# | data: 28/03/11 | godz.: 22:47)
Mrogi pysiu! Co mnie obchodzi ilość alu? Co mnie obchodzą marketingowe niby sztuczki? Skoro tfoje NV jest ponoć takie zajefajne, to czemu jak się odpali najpopularniejszy typ softu pod GPU czyli gierka dx10/dx11, to miszcz śfiata nv jest za murzynem amd? Możesz mi to kurde wytłmaczyć? Tylko nie pitol o zamiataniu podłogi, albo że eyefinity to jest bezsens (wytłumacz to 20 osobom w mojej pracy misiaku! - na NV mogą co najwyżej splunąć albo dosłownie puścić pawia po 15 minutach "3D by NV") i inne takie. I przy okazji Twoje "fakty", to są dokładnie takie fakty jak choćby w TVN - pełne "obiektywizmu" i poparte "realnymi" dokumentami - LOL. Postaraj się mówić tak żeby inni zrozumieli a nie musieli się starać dociekać co autor ma na myśli.
@Aamitoza (autor: MateushGurdi | data: 28/03/11 | godz.: 23:00)
do mnie mowisz pierdzielisz a potem stwierdzasz ze ilosc musi byc parzysta, wlasnie o ilosc chodzi i uzycie poteg dwojki, specyfikacja bylaby znacznie bardzie prawdopodobna dla 6144 procesorow strumieniowych, zreszta masz racje co do TMU. Dlatego uwazam ze nalezy ta informacje traktowac z przymruzeniem oka. Troche za wczesnie na takie szczegoly. Ba, zaj*****ie za wczesnie :] Sorry jesli Cie czyms moglem w slowie dzis urazic ale ciezki dzien mialem :)
... (autor: Aamitoza | data: 28/03/11 | godz.: 23:31)
Bo pierdzieliłeś ;). Ilość SIMD dla GPU MUSI być parzysta - owszem, a 50 i 100 jest parzyste (czyż nie? :)). Jednak dla graphics engine(cayman posiada dwa takie, poprzednie modele posiadały tylko jeden) już nie musi być parzysta i może pod nim być 2/3/11 czy też 25 SIMD.

więc 6400SP dla 2 GPU i 3200 dla jednego jest jak najbardziej prawdopodobne.

z innej beczki, skoro piszesz, że 6144 jest bardziej prawdopodobne, to powiedź mi, w czym 48SIMD jest bardziej parzyste od 50? ;) Bo ani jedno, ani drugie potęgą dwójki nie jest, a jedynie wielokrotnością - i tylko to jest w przypadku architektury z 2 graphics engine ważne ;P Gdybyśmy mieli dalej jedno graphisc engine, to mogło by być nawet 51SIMD i 3264SP gdyby AMD miało taki kaprys.
@69,70 (autor: Mariosti | data: 29/03/11 | godz.: 13:36)
Graphics Engine logicznie może sobie poradzić z nieparzystą liczbą CU, to nie jest problem, prawda. Problem polega na tym że projektując układ masz do dyspozycji pewną powierzchnię na krzemie... spróbuj zrobić prostokąt wypełniony nieparzystą liczbą kwadratów tej samej wielkości... niemożliwe ;> Chodzi o to że tak czy siak jak najlepiej będzie wykorzystana dostępna powierzchnia krzemu i domyślnie wypuszcza się układ wykorzystujący wszystkie swoje tranzystory. Dlatego też liczba CU przypadająca na każdy graphics engine też będzie parzysta, bo musi być fizycznie, a nie logicznie. Nie musi być natomiast potęgą 2'ki, to bez sensu.

Co do specyfikacji... 3200sc dla vliv5 -> 640SP, 32CU(20SP,4TMU każdy, co byłoby odejściem od obecnego schematu, ale to nie jest przecież wykluczone).
Dla vliv4 -> 800SP, 32CU(25SP,4TMU).
Zasadniczo liczba SP w CU powinna pozostać na dotychczasowym poziomie 16'stu ponieważ jest to powiązane z szybkim kopiowaniem danych z ram'u, dotychczasowe algorytmy zoptymalizowane pod tym kątem nie byłyby w stanie sensownie wykorzystać takiego gpu... nie wiadomo... tak czy siak bardziej prawdopodobna byłaby taka konfiguracja dla RV1000->2048sc,512SP,128TMU,32CU, albo 3072sc,768SP,192TMU,48CU.
@temat (autor: Mariosti | data: 29/03/11 | godz.: 13:50)
Spojrzałem jeszcze raz na liczby no i można to tak przeanalizować:
1. Stosunek mocy obliczeniowej fp/dp to 4, co jednoznacznie sugeruje architekturę VLIV4
2.Proces spada o 1.5node'a, czyli powierzchnia np Cayman'a w 40m wynosząca 389mm^2 w 28nm wynosiłaby około 190mm^2. To daje ogromne pole do popisu jeśli chodzi o nowe karty, można spodziewać się wszystkiego ;>
3. 243.2GT/s/256TMU daje taktowanie 950MHz... ok to możliwe, 91.2GP/s/96ROP też daje taktowanie 950MHz więc mamy tutaj przynajmniej zgodność.
8*(576GB/s/(2*384bit)) daje 6GHz taktowanie dla ram'u... sporo jak na tak szeroką magistralę pamięci... ale wciąż możliwe... Jak widać powyżej tylko ta liczba sp do tmu nie pasuje... ale ogólnie można się spodziewać 2x więcej niż w caymanie sp i 384bitowej magistrali pamięci , bo pozwoli na to po prostu proces.
ale da (autor: scoobydoo19911 | data: 29/03/11 | godz.: 14:22)
się zrobić prostokąt wypełniony nieparzystą liczbą kwadratów chociażby 3x3
Mariosti (autor: Aamitoza | data: 29/03/11 | godz.: 14:23)
gdzie tutaj widzisz, to o czym piszesz?

Masz dwa bloki ( na środku układu)i parzysta liczba SIMD musi być, ale dla całego układu. Każdy z tych w oddzielnych bloków może mieć nieparzystą liczbę SIMD pod sobą.

"spróbuj zrobić prostokąt wypełniony nieparzystą liczbą kwadratów tej samej wielkości... niemożliwe ;>"

Problem w tym, że SIMD w radeonach nie są kwadratami, tylko szerokimi prostokątami, a z szerokich prostokątów długości jednego boku jesteś w stanie zbudować kwadrat jak i prostokąt.
scoobydoo19911 (autor: Aamitoza | data: 29/03/11 | godz.: 14:25)
no da się, ale ten prostokąt nadal posiada własności kwadratu, więc pozostawia małe pole do popisu ;)
73. (autor: Mariosti | data: 29/03/11 | godz.: 15:42)
3x3 z kwadratów stworzy tobie kwadrat, nie prostokąt... możesz kombinować w stylu 3x7, ale wtedy do żadnego z boków tego prostokąta nie możesz się symetrycznie podpiąć (a jak wiemy te bloki nie są zawieszone w powietrzu, tylko połączone z resztą gpu i tutaj nie stosuje się niesymetrycznych łącz).

@74.
Napisane wszystko jest bardzo wyraźnie ;] Liczba TMU jest podzielna przez 16, po 4 tmu przypadają na CU(SIMD), czyli liczba CU musi być podzielna przez 4, nie przez 2. No i dochodzi kwestia połączeń wspomniana powyżej.
add (autor: Mariosti | data: 29/03/11 | godz.: 15:46)
W r600, r700 i r800 było po jednym graphics engine, dlatego wystarczyło aby ich liczba CU była parzysta.
@add2 (autor: Mariosti | data: 29/03/11 | godz.: 15:46)
Chodzi o fizyczną liczbę bloków w układzie, nie o to co da się obsłużyć logicznie.
Mariosti (autor: Aamitoza | data: 29/03/11 | godz.: 15:49)
Ale co to ma do rzeczy?

Albo jedna (SP), albo druga wartość (TMU) nie jest prawdziwa. Ja udowodniłem, że taka ilość SPU jest możliwa, jednak dla 200TMU, a Ty udowodniłeś, że tka ilość TMU jest możliwa, ale dla 2048SP - o czym i tak już wcześniej wyraźnie napisałem. w 57.

Ilość ROP/RBE nie ma powiązania z ilością SPU.
@79. (autor: Mariosti | data: 29/03/11 | godz.: 16:40)
Z tego też względu nie było mowy o rop'ach, a z kolei 200 jest raczej niemożliwe, prędzej można się spodziewać 192TMU o czym też wspomniałem.
Ale (autor: scoobydoo19911 | data: 29/03/11 | godz.: 16:50)
Od kiedy kwadrat nie jest prostokątem?
Mariosti (autor: Aamitoza | data: 29/03/11 | godz.: 16:52)
192 miałbyś gdyby gpu miało 48SIMD (dokładnie 2x więcej SPU. Ale 50SIMD jest równie prawdopodobne. A w parze z 50SIMD idzie 200TMU.

Zastanawia mnietylko jak zgrupują taką ilość SIMD. czy tak jak obecnie - dla jednego Graphics engine jedne blok po 24 lub 25 SIMD (wtedy będzie możliwy taki układ o jakim ja piszę, a także taki o którym Ty piszesz) czy też zrobią taki zabieg jak w cypresie, ze do jednego Graphics engine będą przypisane 2 symetryczne bloki co nam da po 12 SIMD na blok i tutaj będzie możliwa jedynie taka konfiguracja o której Ty piszesz.

I szczerze mówią, jeżeli AMD chce mieć układ bliższy kwadratowi, to ta 2 opcja będzie zdecydowanie lepsza (4 bloki po 2 dla graphics engine), bo w pierwszej wyszło by coś na wzór GF114 jak nie jeszcze dłuższy niż szerszy.
@Mariosti (autor: Promilus | data: 29/03/11 | godz.: 16:53)
Niby czemu 200TMU jest niemożliwe, toż to 10x tyle co HD5670 (20TMU, 400ALU czyt. prawie akurat połówka HD4870). G80/92 miało odmiany z 48, 56, 60 i 64TMU jeśli dobrze pamiętam. Jedyne co jest z TMU to podzielność przez 4 (bo jeden klaster TMU odpowiada właśnie 4TMU ze starszych generacji, to samo ROPy). A reszta zasadniczo ma mniejsze znaczenie bo ciąć można różnie i budować z bloczków też różnie. Np. GTX480 miał 15 z 16SM czyli nieparzysta liczba. A nieparzysta*parzysta=parzysta
Nie interesuja mnie (autor: morgi | data: 29/03/11 | godz.: 16:57)
openszitowe demka podmaszczone pod archi minimalnych jak sandry i inne bzdety, godnosc nakazuje wziasc duza garsc inny benchow i demek, ktora wykazuja dokladnie odwrotna robote, starych czy mniej starych, sa i takie ktore w miare rowno rozkladaja sily, czyli Nvidia na czele z pewna przewaga nad starymi seriami i halastra.
@84 (autor: cana | data: 29/03/11 | godz.: 17:20)
no to dawaj acan bez opieszałości te inne demkamiast jezorem jak jaka czerepacha mleć :P
@83. (autor: Mariosti | data: 29/03/11 | godz.: 19:11)
Musi być to liczba podzielna przez 4*liczba graphics engine.

GTX480 fizycznie miał 16SM tylko jeden nieaktywny. Rozchodzi się głównie o to co faktycznie robi się w krzemie.
@Mariosti (autor: Promilus | data: 29/03/11 | godz.: 19:38)
Kurka, to jakby zamiast 16tego w Fermi dali duży cache L3 między RAM a L2 to nagle chip przestałby działać? No nie. Nie ma żadnych wytycznych dot. konkretnych ilości SIMD Cores/Stream Multiprocessors w układzie. I nie, tam jest tyle różnego badziewia obok tych równych fragmentów TMU+SP że wcale nie jest wymagana ich parzysta liczba KONSTRUKCYJNIE (w znaczeniu klastra 4TMU+x SP). Po prostu robi się tak dla zachowania symetrii układu i zapewnienia w miarę równomiernego nagrzewania kości. Jak spojrzysz na skany kości to prawie wszystkie przynajmniej w jednej osi są symetryczne, a czasem w obu osiach (GF100).
Promilus (autor: Gigant | data: 29/03/11 | godz.: 21:16)
http://www.techpowerup.com/...766&postcount=99
Wypłacalne jest te compute4cash? Podobno płacą $0.2/WU. Jeżeli Radeon HD6970 może wykonać obliczenia na kwotę 0.9 WU/hr to wychodzi, że można zarobić 130$/miesiąc.
Przy dwóch kartach HD6990 masz już 520$/miecha. 1500zł - jakieś 200zł za prąd i masz na czysto 1300zeta. To już zaczynają być poważne pieniążki.
@87. (autor: Mariosti | data: 29/03/11 | godz.: 21:24)
Konstrukcyjne powody też są ku temu. Obecnie układy robi się w systemie wyspowym, aby czas propagacji sygnałów elektrycznych nie stanowił problemu w tak dużych gpu i przy tak wysokich taktowaniach, ale jednym z jego istotnych aspektów są wysokie wymagania co do długości wszelkich ścieżek przesyłowych. W symetrycznym układzie jest o to znacznie łatwiej, więc na dobrą sprawę odpowiem na twoje pytanie: tak, GF100 z dodatkowym cache w miejscu jednego klastra simd mógłby z dużym prawdopodobieństwem nie działać, a już na pewno nie byłby w stanie osiągać porównywalnego z GF100 taktowania.
Projektowanie takich układów to arcy trudna sztuka, nie wolno jej aż tak upraszać... swoją drogą byłaby to fajna rzecz do robienia w życiu ;]
@Gigant (autor: Promilus | data: 29/03/11 | godz.: 21:38)
Wypłacalne, ale jest limit bodajże 300 albo 600$ na rok.
@Mariosti - tylko nieaktywny SM w GTX480 to jest dla układu DZIURA, a zamiast niej mogłoby być a) lepszy dekoder wideo b) cache c) inne badziewie
Cache L3 w Thubanach jest zupełnie w różnej odległości dla "doklejonych" 2 rdzeni w stosunku do rdzeni z deneba, a jakoś procesor działa i problemu nie ma. Zdaję sobie sprawę z problemów o których piszesz, ale to nie z tego względu, a w każdym razie nie koniecznie z tego względu jest to robione w ten sposób.
Promilus (autor: Gigant | data: 29/03/11 | godz.: 22:00)
600$ to tylko dla amerykanów bez W9 bo dla reszty świata nie ma limitu. W Polsce trzeba będzie podatek odprowadzać jak przekroczysz kwotę 3091,00 zł/rok która jest wolna od podatku.
btw (autor: Gigant | data: 29/03/11 | godz.: 22:02)
Chcialem się zapytać czy ktoś z twoich znajomych czy ty dostał kase od nich? i czy ten biznes jest długoterminowy, tzn czy warto się pakować w to na serio?
specyfikacja 7990 to fail jakich mało (autor: Qjanusz | data: 29/03/11 | godz.: 23:20)
ale sam fakt pojawienia się takich informacji (nawet nie prawdziwych), jest kłopotliwe dla nVidii.
Sprawa z TMU jest bardzo prosta (autor: Zbyszek.J | data: 30/03/11 | godz.: 03:10)
Dużym problemem w architekturze AMD jest stopień wykorzystania poszczególnych bloków SIMD. Jeden procesor UTD (ultra Threaded Dispatch) obsługuje dość dobrze kilka bloków SIMD, a kilkanaście już słabiej.

Z tego powodu Barts z dwoma procesorami UTD dogania Cypressa, pomimo mniejszej ogólnie liczby bloków SIMD - po prostu są one lepiej wykorzystane przez 2 UTD niż przez jeden (w Cypressie).
Pamiętam testy Radeon HD 4830 (8 SIMD) vs 4850 (10 SIMD) przy wyrównanych zegarach, teoretycznie różnica z większej ilości bloków SIMD wynosiła 25%, ale wydajność 4850 była tylko 5-10% wyższa ---> stopień wykorzystania dodatkowych bloków SIMD wyniósł zaledwie około 30-40%.

Dlatego w nowszych architekturach jednostki TMU mają być wydzielone z bloków SIMD i współdzielone pomiędzy wszystkie procesory strumieniowe. W końcu lepiej mieć w układzie mniej lepiej wykorzystanych TMU, niż więcej ale słabiej wykorzystanych.

Dlatego w przypadku tej specyfikacji liczba TMU może być niepowiązana z liczbą bloków SIMD, i to jest całkiem realne.
PS. Przepraszam za trochę nieskładną pisownie, jest już późno w nocy :)
@Zbyszek.J (autor: Promilus | data: 30/03/11 | godz.: 07:55)
Tylko problem jest taki, że one muszą być powiązane z TMU, bo to stamtąd zczytują tekstury które obrabiają pixel shaderami, a to o czym mówisz jest możliwe, ale wymagałoby zilion razy lepszego dispatch processora.

D O D A J K O M E N T A R Z

Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.