GPU Cayman ma powierzchnię 389 mm²

M E N U

» Nowości

» Archiwum

» Recenzje / Testy

» Board

» Rejestracja

Szukaj @ TwojePC

Poniedziałek 13 grudnia 2010

GPU Cayman ma powierzchnię 389 mm² Autor: Zbyszek \| źródło: Xtreme News \| 17:55	(36)
Premiera pierwszych kart graficznych z serii Radeon HD 6900 już za 2 dni. Jak się okazuje układ Cayman będący sercem kart składa się z około 2,64 miliarda tranzystorów umieszczonych na powierzchni 389 mm² i zawiera do 30 bloków SIMD. Tym samym nowy chip jest większy od układów Cypress montowanych na kartach Radeon HD 5800, które składają się z 2,15 miliarda tranzystorów i mają powierzchnię 334 mm². Dla porównania powierzchnia układów GF110 będących sercem kart GeForce GTX 570 i 580 wynosi 520 mm², natomiast układy GF104 montowane na kartach GeForce GTX 460 mają powierzchnię około 360 mm². Zobacz także: 22.11.2010 \| 21.30 \| Architektura kart Radeon HD 6900 Płytka PCB karty Radeon HD 6970 z układem Cayman

K O M E N T A R Z E

480 shaderow (autor: Arlic | data: 13/12/10 | godz.: 18:55)
jeżeli to prawda co tu pisze, to papa GTX580
@Arlic (autor: rainy | data: 13/12/10 | godz.: 18:58)
Myślę, że jednak 1536 (384).
Być może AMD przymierzało się do wariantu 1920 (480) SP ale wówczas ten układ musiał by mieć większą (dość wyraźnie) powierzchnię i TDP.
no ale 30 bloków sidm - 1920SP (autor: Arlic | data: 13/12/10 | godz.: 19:08)
dlatego mówię że jeżeli to co w newsie to prawda..
@Arlic (autor: emuX | data: 13/12/10 | godz.: 19:17)
wydajność HD6970 jest już znana i jest +/- zależnie od testu równa GTX570. Za to zdziersko wysoki są ceny sugerowane nowych kart AMD, przez które sprzedawcy mogą zawyżać ceny kart nV.
my wiemy (autor: piobzo | data: 13/12/10 | godz.: 19:30)
emu..

jak mogło się obejść bez fotek pudełka:E
@rainy (autor: Promilus | data: 13/12/10 | godz.: 19:31)
Teraz zadanie dla liczydłowych.
32ROP/80TMU Cypress 334mm2
32ROP/56TMU Barts 255mm2
32ROP/x TMU Cayman 389mm2 :P
rozwijam zakładając tą samą powierzchnię ROP i TMU w barts i cypress (uzasadnione założenie)
32x+80y=334
32x+56y=255
x=~2.2, y=~3.3
Teraz... zakładam, że ROP w Caymanie zajmuje tyle co w barts i cypress to na TMU i SP zostaje z 389mm2 aż 319mm2. Jeśli teraz zupełnie teoretycznie założy się iż TMU z architekturą VLIW5 shaderów zajmuje tyle co TMU z architekturą VLIW4 (również uzasadnione) to mamy 319/3.3=96 (i pół... na takie rzeczy jak UVD czy UTDP, teselator itp). 96*4SP=384. 384SP*4ALU=1536. I wygląda na to, że własnie tak będzie.
@emuX (autor: draconewt | data: 13/12/10 | godz.: 19:33)
Krakusie mam nadzieję, że przeprosisz wszystkich czytelników twojepc za kłamstwa na temat wydajności HD6970 jeżeli za 2 dni okaże się że jest inaczej niż twierdziłeś.
haha (autor: Simon89 | data: 13/12/10 | godz.: 19:45)
Jeszcze nie wyszły karty 6900 a emu'lator już podaje że to AMD jest winne wysokim cenom kart 570 i 580. Paranoja, lecz się.
570 - 1400zł
580 - 2000zł

Jeszcze podam,jak byędzie wyglądała oferta AMD, bo widzę że nie zostało to wyjaśnione do końca.
5570: 250-300zł
5670: 300-350zł
5750: 400-450zł
5770: 450-500zł
6850: 650-750zł (wskoczyła na miejsce 5830)
6870: 850-950zł (wskoczyła na miejsce 5850)
6950: 1200-1300zł (sądzę że wskoczy na miejsce 5870)
6970: 1400-1500zł (sądzę że w tym przedziale będzie konkurowała z GTX570, chyba że będzie wydajniejsza)
HD6850 od powercolora (autor: Arlic | data: 13/12/10 | godz.: 20:00)
kosztuje 610zł
@Arlic (autor: Simon89 | data: 13/12/10 | godz.: 20:11)
wartości podawałem po sprawdzeniu średnich cen. To normalne że są wyjątki, tak jak od każde reguły ;). Są karty droższe i tańsze, czasem bywa tak, że ceny różnych modeli nawet zazębiają się.
Ładnie sie chyba będzie kręcił krokodylek (autor: Jarek84 | data: 13/12/10 | godz.: 20:13)
http://forums.overclockers.co.uk/...;postcount=135

A tu pare pre-testów - 2GB w full HD i wyżej na pewno się przyda - tylko teraz to nie wiem czy bliżej tej karcie do GTX580 czy GTX570 (w każdym bądź razie jak na circa 25% mniejsza powierzchnię od GF110 jest lepiej niż dobrze)

http://i53.tinypic.com/2r5atkm.jpg
... (autor: Wujofefer | data: 13/12/10 | godz.: 20:16)
Nawet jeśli się okaże, że 6970 jest troszkę wydajniejszy od GTX570 i wolniejszy od GTX580 to trzeba zwrócić uwagę na fakt że jest znacznie mniejszy od GF110.
Jak to jest, że AMD zrobiło chip o wielkości 75% topowego chipu Nvidii i wydajności pi razy oko 90-95% (na dokładne dane poczekamy do środy).
Wszystkie znaki na niebie i ziemi wskazują na to że lepszą architekturą dysponuje AMD. Nvidia musi użyć znacznie więcej tranzystorów na większej powierzchni, które pobierają więcej prądu by móc konkurować z mniejszym ale wydajniejszym Caymanem.
@ Promilus #6 (autor: Zbyszek.J | data: 13/12/10 | godz.: 20:20)
"Jeśli teraz zupełnie teoretycznie założy się iż TMU z architekturą VLIW5 shaderów zajmuje tyle co TMU z architekturą VLIW4 (również uzasadnione) "

Założenie nie tylko nie uzasadnione ale całkowicie błędne.
1) Według AMD VLIW4 oferuje tą samą wydajność przy 90% zajmowanej powierzchni. Biorąc pod uwagę 5-10% spadek wydajności po przejściu z VLIW5 do VLIW4, to powierzchnia bloków SIMD w architekturze VLIW4 to około 0,8-0,85 powierzchni bloków w architekturze VLIW5. Inaczej mówiąc, na tej samej powierzchni mieści się ~ 20% więcej bloków SIMD VLIW4 niż bloków SIMD VLIW5, a ich wydajność jest 10-15% większa.

2) We wszystkich układach z architekturą VLIW5, począwszy od R600 do Cypressa i Bartsa włącznie w każdym bloku SIMD znajdowały się zapasowe jednostki, przez co uzysk był wysoki:
http://twojepc.pl/news18150.html

Na etapie projektowania jednostek SIMD z architekturą VLIW4 najprawdopodobniej zdecydowano się je usunąć aby zaoszczędzić miejsce i zejść z powierzchnią poniżej 400mm^2. Stąd bardzo niski uzysk Caymana:
http://twojepc.pl/news22638.html

i w jego następstwie w R6970 aktywne tylko 24 bloki SIMD. Nic innego poza wycięciem tych jednostek nie jest w stanie wyjaśnić niskiego uzysku Caymanów.

Przelicz sobie jeszcze raz ile bloków SIMD zmieści się w 389mm^2, biorąc pod uwagę wcześniej przedstawione punkty 1 i 2.
errata (autor: Zbyszek.J | data: 13/12/10 | godz.: 20:21)
"zejść z powierzchnią Caymana poniżej 400mm^2."
@Wujofefer (autor: emuX | data: 13/12/10 | godz.: 20:58)
czip nV jest większy bo ma jednostki odpowiadające za fizyks. AMD nie ma takich fiuczersów i dlatego gry na kartach AMD są bardziej statyczne. Także nie wiem o jakiej "lepszości" architektury mówisz kart AMD mówisz.
hiehie (autor: morgi | data: 13/12/10 | godz.: 21:02)
To Nvidia znowu okazala sie gora bo udalo im sie zmniejszyc chip i podniesc wydajnosc, a tu wpadka, teraz beda preparowac i wyszukiwac haki, ze w kilku miejscach maja wiecej na slupkach. Trzeba to bedzie dokladnie sprawdzac, bo fps rosna kiepskim pod wplywem optymalizacji, co powinno byc ganione i karane.
@15 (autor: Jarek84 | data: 13/12/10 | godz.: 21:04)
A tak z ciekawości - jak się te jednostki nazywają? I zarzuć z łaski swojej jakimś linkiem gdzie te mityczne jednostki są opisane, ewentualne (może będzie Ci łatwiej) są jakieś slajdy ze schematem tychże...
@Zbyszek.J (autor: Promilus | data: 13/12/10 | godz.: 21:18)
"Według AMD VLIW4 oferuje tą samą wydajność przy 90% zajmowanej powierzchni."
Źródło proszę.
"Biorąc pod uwagę 5-10% spadek wydajności po przejściu z VLIW5 do VLIW4, to powierzchnia bloków SIMD w architekturze VLIW4 to około 0,8-0,85 powierzchni bloków w architekturze VLIW5"
Twoje wywody o tyle błędne, że zapomniałeś iż "gruby" ALU z VLIW5 występuje w VLIW4 częściej, a nie jest wycięty zupełnie.
"a ich wydajność jest 10-15% większa"
Bzdura. Powinieneś napisać efektywność a nie wydajność. 4ALU robiące 1op/cykl nie mogą być bardziej wydajne od 5 kolego!
"Stąd bardzo niski uzysk Caymana"
Plotki nigdzie nie potwierdzone... pewnie równie rzeczowe co 3% GF100.
"i w jego następstwie w R6970 aktywne tylko 24 bloki SIMD"
Nie przeginasz aby? A skąd wiesz, że to zapasowe TMU+SP są a nie kilka bloków SP w SIMD, a TMU sobie lecą normalnie? Powtarzasz tylko to co kiedyś w czasach RV790 ktosik wymyślił, ale potwierdzenia ze strony AMD nigdy nie było. Zresztą... wyszedł kiedyś RV790 extreme z 960SPu zamiast 800? No nie powiesz mi chyba, że się im ani jedna sztuka w 100% sprawna nie trafiła...
"Przelicz sobie jeszcze raz ile bloków SIMD zmieści się w 389mm^2, biorąc pod uwagę wcześniej przedstawione punkty 1 i 2"
Nie, ty sobie przelicz i podaj co ci wyszło. 1920? Może, ale wątpię. Gdy pojawiły się pierwsze ploteczki nt. 1920 to pisałem, że układ i tak byłby mniejszy zarówno od GF100 jak i 110, ale byłby większy niż 400mm2. VLIW4 to nie dokładnie te same x, y, z, w co w R600, RV770, cypress czy barts, a co najmniej 2 z tych jednostek wzbogacono o f. trygonometryczne, potęgowanie itp. - czyli wszystko to co robiła do tej pory skalarna jednostka TRANS. Co najmniej dwa alu, ale równie dobrze mogą być wszystkie w ten sposób by zapewnić pełną symetrię. A to oznacza, że wszelkie spekulacje dot. 80% powierzchni VLIW5 są równie wiarygodne co moje wyliczenia. Tyle, że moje pokrywają się z dotychczasowymi przeciekami, a swoich nie pokazałeś.
@ morgi #16 (autor: Zbyszek.J | data: 13/12/10 | godz.: 21:21)
"fps rosna kiepskim pod wplywem optymalizacji, co powinno byc ganione i karane"

Zobacz jak Nvidii rosną FPS :

http://www.xtremesystems.org/...;highlight=GTX+580

A teraz powiedz co jest bardziej uczciwe: ustawienie jako defalut opcji wydajność zamiast jakość, co każdy może ręcznie zmienić na jakość jak mu sie podoba (AMD) czy wykrywanie nazwy pliku wykonywalnego i bokiem potajemne zmniejszanie jakości obrazu (NV) ??
@emuX (autor: Promilus | data: 13/12/10 | godz.: 21:21)
Taa... jednostki odpowiedzialne za fyziks... weź sobie kujawski z pierwszego tłoczenia i wlej całą butlę bo ci trybiki się zatarły. Istniejące procedury firmy AGEIA przystosowane do jej PPU zostały nieco rozbudowane i przepisane z wykorzystaniem CUDA. I tyle. Żadnych magicznych jednostek fizyki tam nie ma, a normalne shadery pałko!
@ Promilus # 18 (autor: Zbyszek.J | data: 13/12/10 | godz.: 21:22)
Proszę bardzo źródło:
http://twojepc.pl/graph0/news10/22743_6.jpg
@up (autor: Promilus | data: 13/12/10 | godz.: 21:28)
A ja tam widzę "allow better utilization than previous vliw5" oraz 'all units now have equall capabilities (no more T units)"
Poza tym "similar" to nie to samo co "the same", a w kontekście oznacza to, że W TYPOWYM użytkowaniu ma to podobną wydajność, ale absolunie nie że VLIW4 ma taką samą wydajność jak VLIW5 bo to oznaczałoby że od ponad 3 lat AMD byli totalnymi idiotami pchając 5 ALU zamiast 4.
Zbyszek (autor: morgi | data: 13/12/10 | godz.: 21:42)
hiehie profile dziala jednakowo u Nvidi dawno u kiepskich niedawno i jak widac mozna to banalnie obejsc. Machinacje i wbudowane optymalizacje juz nie, anizo w radeonkach jest zepsute do konca, nikt teego nie obejdzie.
zadziwiająco mało skomplikowana płytka pod Caymana (autor: Qjanusz | data: 13/12/10 | godz.: 22:31)
co do architektury, to strach blady padł na nVidię po raz kolejny.

Cayman jest niewiele większy niż GTX460, który wydajnością stoi dwa ogonki dalej.
GF110 przy Caymanie to wielka stodoła. Oj oby tylko AMD zdołało zapełnić popyt na nowe Radki, to pęknie może ceną manipulować w stosunku do zielonej i gorącej stodoły.

Warte odnotowania są rewelacje spisane przez naszego power-usera.
Specjalne jednostki od fisyks na GeForcach :D
Wyobraźcie sobie największego głąba na świcie.
Tak, właśnie został zawstydzony przez jedynego w swoim rodzaju geniusia z Krakowa.

Bidul uwierzył w krasnoludki biegające po GFach, które trudnią się przerzucaniem papierków w Batmanie :D

@Promilus - nie chcę wchodzić między wódkę a zakąskę, ale też czytałem w różnych serwisach, że VLIW4 zapewni tę samą wydajność przy mniejszej powierzchni TMU w stosunku do VLIW5
Buhahahahahahahahahahaha... xD (autor: Wujofefer | data: 13/12/10 | godz.: 23:02)
Nie no emuX to mnie zadziwił. Odkrył coś o czym sami inżynierowie Nvidii nie wiedzą. :P
Pan "świecące spocone czoło" właśnie nerwowo przegląda specyfikacje układów w poszukiwaniu ukrytych jednostek fiziks xD
Natomiast na Guru3D i wielu innych portalach zdejmowane są chłodzenia i układy trafiają pod lupę by pokazać dopiero co odkryte fiuczery fiziksy całemu światu. xD
Och dzięki emuX GeForce zyskały nową moc i nowe rdzenie fiziks do walki z Radeonami xD
Nvidia już wysyła zielonego mikołaja z prezentem za tak wspaniałe odkrycie, już wiadomo kto w tym roku dostanie nagrodę nobla w dziedzinie fiuczerów/fiziksów. xD

ps. sorry, nie mogłem się powstrzymać xD
@Qjanusz (autor: Promilus | data: 14/12/10 | godz.: 08:11)
U góry masz źródło oraz tłumaczenie...
SIMILAR - podobną (ale w kontekście typowego użytkowania, a nie szczytową), podobna wydajność to nie TAKA SAMA. Poza tym choćby Collatz intensywnie wykorzystujący bodajże wszystkie jednostki w VLIW5 z pewnością z takim twierdzeniem się nie zgodzi. Z drugiej strony Milkyway korzystający WYŁACZNIE z 4of5 ALU nawet nie poczuje różnicy, a może nawet przyspieszy dzięki lepszemu cache i nowym rozkazom. Tak samo przyspieszą aplikacje intensywnie korzystające z funkcji specjalnych, bo po prostu więcej ALU będzie je mogło przetwarzać. Dlatego VLIW4 to efektywniej i w TYPOWYM UŻYTKOWANIU cechuje podobna wydajność, ale absolutnie nie zgadzam się z tezą jakoby było OGÓLNIE RÓWNIE WYDAJNE co VLIW5. Jak widzisz 1536 SP @880MHz jest ciutkę mniej wydajne niż 1600SP@850MHz i chyba od razu widać o co chodzi. Poprawiono efektywność wykorzystania ALU, przez wywalenie jednostki skalarnej zostały 4ALU więc FP64 to teraz 1/4 FP32a nie 1/5 jak wcześniej. Ale VLIW4 kontra VLIW5 w FP64 ma taką samą wydajność 1SP kontra 1SP. A w FP32 ma MNIEJSZĄ. I nie ma się co z tym kłócić. Takie są fakty.
Były 4 motorynki i 1 motocykl, a teraz są 4 skutery. Bardziej eleganckie podejście, ale koni mechanicznych mniej.
@EmuX (autor: AmigaPPC | data: 14/12/10 | godz.: 09:14)
te (tak naprawdę nieistniejące o czym taki Power User jak Ty wiedzieć powinien) "jednostki odpowiadające za fizyks" muszą być cholernie prymitywne i niewydajne skoro włączenie PhysX powoduje (w większości tytułów) spadek FPS o około 50%.
emuX zapadł sie pod ziemię, chyba ze wstydu xD (autor: Wujofefer | data: 14/12/10 | godz.: 09:52)
Po tak żenującej wpadce jeden z trolli zniknął na pewien czas, pewnie stara się przeczekać i zaatakuje gdy już wszyscy zapomną o jego rdzeniach fiuczer fiziks xD

Swoją drogą, już nie mogę doczekać się jutrzejszych testów na in4 i TwojePC. :)
@Up (autor: AmigaPPC | data: 14/12/10 | godz.: 10:03)
a ja np. na Techpowerup czy Guru3D :)
@Wujofefer (autor: Qjanusz | data: 14/12/10 | godz.: 10:07)
w szkole zapewne siedzi i poprawia zawaloną ostatnią klasówkę z WFu

@Promilus - Collatz to w tym przypadku udziergany pod konkretną architekturę kawałek dobrze zoptymalizowanego softu. Taki kod nie ma racji bytu w komercyjnym zastosowaniu. Liczy się dostępna masówka, która lepiej korzysta z większej liczby VLIW4. Taka prawda, choć trzeba napisać NIESTETY.
@Qjanusz (autor: Promilus | data: 14/12/10 | godz.: 10:24)
Tak samo lepiej wyjdzie VLIW2 niż VLIW4 a już zupełnie dobrze skalarna... maksymalna możliwa efektywność. Ale nie zrobili skalarnej tylko nadal 4x32bit wektor.
@Promilus (autor: Qjanusz | data: 14/12/10 | godz.: 10:31)
VLIW2 to już masakryczna liczba TU i okolic, zupełnie inna architektura SIMDa. Tu może być więcej szkód niż pożytku.
@Qjanusz (autor: Promilus | data: 14/12/10 | godz.: 10:32)
Dlaczego? Wystarczy taktować 2x wyżej ;)
Promilus (autor: Gigant | data: 14/12/10 | godz.: 12:02)
Nie ma magicznych jednostek? A to ci kawał. Przestań oszukiwać człowieka mitomanie. emuX nie jest głupi i dobrze widzi to co widzi.
@Gigant (autor: bmiluch | data: 14/12/10 | godz.: 13:07)
emuX pewnie ma dobry wzrok i pewnie z jego inteligencją jest OK; problem w tym, że zauważa tylko to co pasuje mu do jego poglądów; niestety - ze względu na jego brak obiektywizmu nikt mu nie uwierzy, nawet jak napisze prawdę
@gigant&bmiluch (autor: Promilus | data: 14/12/10 | godz.: 13:09)
Tyle, że w tym przypadku prawdy nie napisał. Żadnych specjalnych jednostek do fizyki nie ma. Są te same jednostki do pixel/vertex/geometry/compute/domain/hull shader oraz CUDA, PTX, OpenCL.

D O D A J K O M E N T A R Z

Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.