TwojePC.pl © 2001 - 2024
|
|
Środa 28 sierpnia 2013 |
|
|
|
IBM prezentuje architekturę POWER 8 Autor: Wedelek | źródło: WCCFTech | 08:08 |
(16) | Podczas Hot Chip 2013 firma IBM zaprezentowała kolejną generację architektury POWER o symbolu 8, w oparciu o którą będą powstawać nowe procesory tego producenta przeznaczone do zastosowań profesjonalnych. Nowa wersja pojawi się na rynku w postaci 12 rdzeniowych procesorów wytwarzanych w oparciu o 22nm proces litograficzny i technologię SOI, w ramach której stosowana jest dodatkowa warstwa izolująca, co minimalizuje upływ prądu z tranzystorów, a co za tym idzie do zmniejszenia zapotrzebowania na energię podczas przełączenia stanu logicznego na tranzystorach. Jest to autorskie rozwiązanie IBMa, stosowane również w procesorach firmy AMD.
Każdy rdzeń ma do dyspozycji 64KB cache L1 oraz 512KB pamięci podręcznej poziomu drugiego (SRAM) i jest w stanie obsłużyć jednocześnie do ośmiu wątków. Podobnie jak w procesorach x86 AMD wszystkie rdzenie mają do dyspozycji 96MB współdzielonej pamięci podręcznej poziomu trzeciego, oraz (to nowość) do 128MB pamięci eDRAM poziomu czwartego, montowanej poza jądrem krzemowym. W porównaniu do architektury POWER 7 powiększono bufory w których przechowywane są instrukcje do 32KB, usprawniono mechanizm kolejkowania oraz predykcji i zintegrowano w procesorze kontroler zarządzający zasilaniem oraz VRM.
Do tego doszedł kontroler pamięci o przepustowości do 230 GB/s, oraz kontroler PCI-Express 3.0, a procesor może się pochwalić sprzętowym wsparciem dla technik kryptograficznych oraz VMM (virtual machine monitor). W POWER 8 zaszyto również magistrale SMP (Symmetric Multi-Processing) i CAPI (Coherent Accelerator Processor Interface). Ta ostatnia jest odpowiedzialna za szybką wymianę danych pomiędzy procesorem a kartą rozszerzeń umieszczoną w interfejsie PCI-Express 3.0, np. Teslą od Nvidii.
W porównaniu do POWER7 o 60% wzrosła wydajność przetwarzania pojedynczego wątku a w aplikacjach potrafiących wykorzystać wszystkie rdzenie procesora możemy zaobserwować nawet dwukrotny przyrost wydajności. Większa ilość bardziej skomplikowanych rdzeni oraz pamięci pociągnęła za sobą wzrost wielkości rdzenia do 650mm^2, podczas gdy TDP nieco zmalało i wynosi 200W.
|
| |
|
|
|
|
|
|
|
|
|
K O M E N T A R Z E |
|
|
|
- widzę (autor: Markizy | data: 28/08/13 | godz.: 08:38)
że IBM ma fantazje, bo na 22nm wrzuca od razu klocka o wielkości 650mm^2, ciekawi mnie jak duży uzysk będą mieli, a nie wspomnę już o ilości pamięci cache którą montują do niego.
- @1, (autor: TeXXaS | data: 28/08/13 | godz.: 10:08)
Kto bogatemu zabroni? :D Do tego to jest soi.
Z drugiej strony... tam jest 12 rdzeni. Może na początek dadzą mniej. Część pamięci - te 128MB po za chipem jest...
- hmm (autor: piobzo | data: 28/08/13 | godz.: 11:44)
96 wątków nice... power7 miał 4 na rdzeń a tu 8... robi wrażenie...
- żeby (autor: Krax | data: 28/08/13 | godz.: 13:34)
zachować tradycje znowu eram dowalili.
- 650 mm2 (autor: kombajn4 | data: 28/08/13 | godz.: 14:46)
dwanaście rdzeni, 96 wątków i 4 GHz. Że skromnie spytam czym oni to ustrojstwo zamierzają chłodzić? Ciekłym azotem? Nie no wygłupiam się ale ciekawe ile to soczku żłopie z kontaktu bo na pewno nie miało.
- @5. (autor: TeXXaS | data: 28/08/13 | godz.: 16:18)
"TDP nieco zmalało i wynosi 200W." :) sam proc...
- @kombajn4 (autor: Promilus | data: 28/08/13 | godz.: 17:13)
A czym chłodzili 90nm 3 rdzeniowe 2 wątkowe pracujące na 3.2GHz proce? Albo te 4 rdzeniowe @ 5GHz? Masz zrypane odniesienie przez x86.
- @05 (autor: Plackator | data: 28/08/13 | godz.: 17:37)
Powierzchnia jest duża, problemów z chłodzeniem nie powinno być
- poza tym (autor: Kosiarz | data: 28/08/13 | godz.: 18:46)
moze miec wieksza tolerancje niz x86. Ciekawe ile Q3A wyplulby FPSow ;)
- @Kosiarz (autor: Promilus | data: 28/08/13 | godz.: 19:39)
"moze miec wieksza tolerancje niz x86. Ciekawe ile Q3A wyplulby FPSow ;)"
Niewiele, bo masz zilion rzeczy ograniczających prędkość renderingu (zresztą to jedna z wielu rzeczy, które załatwiał XreaL)
- Interesujące... (autor: Atak_Snajpera | data: 29/08/13 | godz.: 17:21)
U Intela mamy np. 4C/8T a u IBM'a 12C/8T. Może mi ktoś wytłumaczyć ten ewenement?
- atak snajpera (autor: Aamitoza | data: 29/08/13 | godz.: 17:58)
u intela masz 1 rdzeń 2 wątki, a u IBM 1 rdzeń i 8 wątków, a nie 12 rdzeni i 8 wątków.
- @Atak_Snajpera (autor: Wedelek | data: 29/08/13 | godz.: 18:06)
Cytuję "Każdy rdzeń (...) jest w stanie obsłużyć jednocześnie do ośmiu wątków", co oznacza, że obsługiwanych jest 12*8= 96 wątków. Czterordzeniowy procesor Intela z rodziny Core obsługuje osiem wątków.
- Wracjąc do tego wydzielnia ciepła (autor: kombajn4 | data: 29/08/13 | godz.: 20:44)
to to taki rdzeń obsługujący 8 wątków musi być nieporównanie bardziej skomplikowany od x86. Większy stopień komplikacji=więcej tranzystorów=więcej ciepła. Chociaż faktycznie 22nm powinny pomóc w tym departamencie. Jednak wydaje mi się (ekspertem od tego nie jestem, ale...) że jak na procesor serwerowy 200 W to nie lichy problem bo pewnie na jeden komp w klastrze przypadać będzie kilka takich procesorów. Z drugiej strony chyba nie ma na rynku niczego innego co by z jednego kawałka krzemu dawało 96 wątków. 8 takich procesorów to już co prawda 1600W ale aż 768 wątków. Robi wrażenie.
- up. (autor: piobzo | data: 30/08/13 | godz.: 00:55)
tesla ma pewnie ze 100W więcej, i tak samo buduje się klastry, czyli raczej problemu nie będzie....
w dobrze chłodzonych szafach nikomu takie tdp nie będzie przeszkadzać, w serwerowni i tak ludzi ryra, że hałas układu chłodzenia ma nawet 50db czy nawet 60,
- @kombajn4 (autor: Promilus | data: 30/08/13 | godz.: 09:31)
"to to taki rdzeń obsługujący 8 wątków musi być nieporównanie bardziej skomplikowany od x86. Większy stopień komplikacji=więcej tranzystorów=więcej ciepła."
Niespecjalnie, skoro sama arch. power nie potrzebuje aż tylu tranzystorów jako typowy RISC więc bez super opasłego dekodera rozkazów i shedulera, register rename itp. Nie potrzebuje. Zatem można się skupić na 2 rzeczach. Ilości wątków sprzętowych co wielkim problemem nie jest, bo jest potrzebny tylko switcher i odpowiednie mechanizmy zarzadzające - CMT czy HT w x86 to zasadniczo kilka % wiecej, a intel zrobił też HT 4 wątkowe do MIC. Wszelkie zapasy tranzystorów poszły w mega wielki cache, który z kolei nie jest aż tak prądożerny - ale wszystko zajmuje dużą powierzchnię.
|
|
|
|
|
|
|
|
|
D O D A J K O M E N T A R Z |
|
|
|
Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.
|
|
|
|
|
|
|
|
|
|