Podczas Hot Chip 2013 firma IBM zaprezentowała kolejną generację architektury POWER o symbolu 8, w oparciu o którą będą powstawać nowe procesory tego producenta przeznaczone do zastosowań profesjonalnych. Nowa wersja pojawi się na rynku w postaci 12 rdzeniowych procesorów wytwarzanych w oparciu o 22nm proces litograficzny i technologię SOI, w ramach której stosowana jest dodatkowa warstwa izolująca, co minimalizuje upływ prądu z tranzystorów, a co za tym idzie do zmniejszenia zapotrzebowania na energię podczas przełączenia stanu logicznego na tranzystorach. Jest to autorskie rozwiązanie IBMa, stosowane również w procesorach firmy AMD.
Każdy rdzeń ma do dyspozycji 64KB cache L1 oraz 512KB pamięci podręcznej poziomu drugiego (SRAM) i jest w stanie obsłużyć jednocześnie do ośmiu wątków. Podobnie jak w procesorach x86 AMD wszystkie rdzenie mają do dyspozycji 96MB współdzielonej pamięci podręcznej poziomu trzeciego, oraz (to nowość) do 128MB pamięci eDRAM poziomu czwartego, montowanej poza jądrem krzemowym. W porównaniu do architektury POWER 7 powiększono bufory w których przechowywane są instrukcje do 32KB, usprawniono mechanizm kolejkowania oraz predykcji i zintegrowano w procesorze kontroler zarządzający zasilaniem oraz VRM.
Do tego doszedł kontroler pamięci o przepustowości do 230 GB/s, oraz kontroler PCI-Express 3.0, a procesor może się pochwalić sprzętowym wsparciem dla technik kryptograficznych oraz VMM (virtual machine monitor). W POWER 8 zaszyto również magistrale SMP (Symmetric Multi-Processing) i CAPI (Coherent Accelerator Processor Interface). Ta ostatnia jest odpowiedzialna za szybką wymianę danych pomiędzy procesorem a kartą rozszerzeń umieszczoną w interfejsie PCI-Express 3.0, np. Teslą od Nvidii.
W porównaniu do POWER7 o 60% wzrosła wydajność przetwarzania pojedynczego wątku a w aplikacjach potrafiących wykorzystać wszystkie rdzenie procesora możemy zaobserwować nawet dwukrotny przyrost wydajności. Większa ilość bardziej skomplikowanych rdzeni oraz pamięci pociągnęła za sobą wzrost wielkości rdzenia do 650mm^2, podczas gdy TDP nieco zmalało i wynosi 200W.
K O M E N T A R Z E
widzę (autor: Markizy | data: 28/08/13 | godz.: 08:38) że IBM ma fantazje, bo na 22nm wrzuca od razu klocka o wielkości 650mm^2, ciekawi mnie jak duży uzysk będą mieli, a nie wspomnę już o ilości pamięci cache którą montują do niego.
@1, (autor: TeXXaS | data: 28/08/13 | godz.: 10:08) Kto bogatemu zabroni? :D Do tego to jest soi.
Z drugiej strony... tam jest 12 rdzeni. Może na początek dadzą mniej. Część pamięci - te 128MB po za chipem jest...
hmm (autor: piobzo | data: 28/08/13 | godz.: 11:44) 96 wątków nice... power7 miał 4 na rdzeń a tu 8... robi wrażenie...
żeby (autor: Krax | data: 28/08/13 | godz.: 13:34) zachować tradycje znowu eram dowalili.
650 mm2 (autor: kombajn4 | data: 28/08/13 | godz.: 14:46) dwanaście rdzeni, 96 wątków i 4 GHz. Że skromnie spytam czym oni to ustrojstwo zamierzają chłodzić? Ciekłym azotem? Nie no wygłupiam się ale ciekawe ile to soczku żłopie z kontaktu bo na pewno nie miało.
@5. (autor: TeXXaS | data: 28/08/13 | godz.: 16:18) "TDP nieco zmalało i wynosi 200W." :) sam proc...
@kombajn4 (autor: Promilus | data: 28/08/13 | godz.: 17:13) A czym chłodzili 90nm 3 rdzeniowe 2 wątkowe pracujące na 3.2GHz proce? Albo te 4 rdzeniowe @ 5GHz? Masz zrypane odniesienie przez x86.
@05 (autor: Plackator | data: 28/08/13 | godz.: 17:37) Powierzchnia jest duża, problemów z chłodzeniem nie powinno być
poza tym (autor: Kosiarz | data: 28/08/13 | godz.: 18:46) moze miec wieksza tolerancje niz x86. Ciekawe ile Q3A wyplulby FPSow ;)
@Kosiarz (autor: Promilus | data: 28/08/13 | godz.: 19:39) "moze miec wieksza tolerancje niz x86. Ciekawe ile Q3A wyplulby FPSow ;)"
Niewiele, bo masz zilion rzeczy ograniczających prędkość renderingu (zresztą to jedna z wielu rzeczy, które załatwiał XreaL)
Interesujące... (autor: Atak_Snajpera | data: 29/08/13 | godz.: 17:21) U Intela mamy np. 4C/8T a u IBM'a 12C/8T. Może mi ktoś wytłumaczyć ten ewenement?
atak snajpera (autor: Aamitoza | data: 29/08/13 | godz.: 17:58) u intela masz 1 rdzeń 2 wątki, a u IBM 1 rdzeń i 8 wątków, a nie 12 rdzeni i 8 wątków.
@Atak_Snajpera (autor: Wedelek | data: 29/08/13 | godz.: 18:06) Cytuję "Każdy rdzeń (...) jest w stanie obsłużyć jednocześnie do ośmiu wątków", co oznacza, że obsługiwanych jest 12*8= 96 wątków. Czterordzeniowy procesor Intela z rodziny Core obsługuje osiem wątków.
Wracjąc do tego wydzielnia ciepła (autor: kombajn4 | data: 29/08/13 | godz.: 20:44) to to taki rdzeń obsługujący 8 wątków musi być nieporównanie bardziej skomplikowany od x86. Większy stopień komplikacji=więcej tranzystorów=więcej ciepła. Chociaż faktycznie 22nm powinny pomóc w tym departamencie. Jednak wydaje mi się (ekspertem od tego nie jestem, ale...) że jak na procesor serwerowy 200 W to nie lichy problem bo pewnie na jeden komp w klastrze przypadać będzie kilka takich procesorów. Z drugiej strony chyba nie ma na rynku niczego innego co by z jednego kawałka krzemu dawało 96 wątków. 8 takich procesorów to już co prawda 1600W ale aż 768 wątków. Robi wrażenie.
up. (autor: piobzo | data: 30/08/13 | godz.: 00:55) tesla ma pewnie ze 100W więcej, i tak samo buduje się klastry, czyli raczej problemu nie będzie....
w dobrze chłodzonych szafach nikomu takie tdp nie będzie przeszkadzać, w serwerowni i tak ludzi ryra, że hałas układu chłodzenia ma nawet 50db czy nawet 60,
@kombajn4 (autor: Promilus | data: 30/08/13 | godz.: 09:31) "to to taki rdzeń obsługujący 8 wątków musi być nieporównanie bardziej skomplikowany od x86. Większy stopień komplikacji=więcej tranzystorów=więcej ciepła."
Niespecjalnie, skoro sama arch. power nie potrzebuje aż tylu tranzystorów jako typowy RISC więc bez super opasłego dekodera rozkazów i shedulera, register rename itp. Nie potrzebuje. Zatem można się skupić na 2 rzeczach. Ilości wątków sprzętowych co wielkim problemem nie jest, bo jest potrzebny tylko switcher i odpowiednie mechanizmy zarzadzające - CMT czy HT w x86 to zasadniczo kilka % wiecej, a intel zrobił też HT 4 wątkowe do MIC. Wszelkie zapasy tranzystorów poszły w mega wielki cache, który z kolei nie jest aż tak prądożerny - ale wszystko zajmuje dużą powierzchnię.
D O D A J K O M E N T A R Z
Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.