Twoje PC  
Zarejestruj się na Twoje PC
TwojePC.pl | PC | Komputery, nowe technologie, recenzje, testy
M E N U
  0
 » Nowości
0
 » Archiwum
0
 » Recenzje / Testy
0
 » Board
0
 » Rejestracja
0
0
 
Szukaj @ TwojePC
 

w Newsach i na Boardzie
 
TwojePC.pl © 2001 - 2024
Środa 28 sierpnia 2013 
    

IBM prezentuje architekturę POWER 8


Autor: Wedelek | źródło: WCCFTech | 08:08
(16)
Podczas Hot Chip 2013 firma IBM zaprezentowała kolejną generację architektury POWER o symbolu 8, w oparciu o którą będą powstawać nowe procesory tego producenta przeznaczone do zastosowań profesjonalnych. Nowa wersja pojawi się na rynku w postaci 12 rdzeniowych procesorów wytwarzanych w oparciu o 22nm proces litograficzny i technologię SOI, w ramach której stosowana jest dodatkowa warstwa izolująca, co minimalizuje upływ prądu z tranzystorów, a co za tym idzie do zmniejszenia zapotrzebowania na energię podczas przełączenia stanu logicznego na tranzystorach. Jest to autorskie rozwiązanie IBMa, stosowane również w procesorach firmy AMD.

Każdy rdzeń ma do dyspozycji 64KB cache L1 oraz 512KB pamięci podręcznej poziomu drugiego (SRAM) i jest w stanie obsłużyć jednocześnie do ośmiu wątków. Podobnie jak w procesorach x86 AMD wszystkie rdzenie mają do dyspozycji 96MB współdzielonej pamięci podręcznej poziomu trzeciego, oraz (to nowość) do 128MB pamięci eDRAM poziomu czwartego, montowanej poza jądrem krzemowym. W porównaniu do architektury POWER 7 powiększono bufory w których przechowywane są instrukcje do 32KB, usprawniono mechanizm kolejkowania oraz predykcji i zintegrowano w procesorze kontroler zarządzający zasilaniem oraz VRM.

Do tego doszedł kontroler pamięci o przepustowości do 230 GB/s, oraz kontroler PCI-Express 3.0, a procesor może się pochwalić sprzętowym wsparciem dla technik kryptograficznych oraz VMM (virtual machine monitor). W POWER 8 zaszyto również magistrale SMP (Symmetric Multi-Processing) i CAPI (Coherent Accelerator Processor Interface). Ta ostatnia jest odpowiedzialna za szybką wymianę danych pomiędzy procesorem a kartą rozszerzeń umieszczoną w interfejsie PCI-Express 3.0, np. Teslą od Nvidii.

W porównaniu do POWER7 o 60% wzrosła wydajność przetwarzania pojedynczego wątku a w aplikacjach potrafiących wykorzystać wszystkie rdzenie procesora możemy zaobserwować nawet dwukrotny przyrost wydajności. Większa ilość bardziej skomplikowanych rdzeni oraz pamięci pociągnęła za sobą wzrost wielkości rdzenia do 650mm^2, podczas gdy TDP nieco zmalało i wynosi 200W.



 
    
K O M E N T A R Z E
    

  1. widzę (autor: Markizy | data: 28/08/13 | godz.: 08:38)
    że IBM ma fantazje, bo na 22nm wrzuca od razu klocka o wielkości 650mm^2, ciekawi mnie jak duży uzysk będą mieli, a nie wspomnę już o ilości pamięci cache którą montują do niego.

  2. @1, (autor: TeXXaS | data: 28/08/13 | godz.: 10:08)
    Kto bogatemu zabroni? :D Do tego to jest soi.
    Z drugiej strony... tam jest 12 rdzeni. Może na początek dadzą mniej. Część pamięci - te 128MB po za chipem jest...


  3. hmm (autor: piobzo | data: 28/08/13 | godz.: 11:44)
    96 wątków nice... power7 miał 4 na rdzeń a tu 8... robi wrażenie...

  4. żeby (autor: Krax | data: 28/08/13 | godz.: 13:34)
    zachować tradycje znowu eram dowalili.

  5. 650 mm2 (autor: kombajn4 | data: 28/08/13 | godz.: 14:46)
    dwanaście rdzeni, 96 wątków i 4 GHz. Że skromnie spytam czym oni to ustrojstwo zamierzają chłodzić? Ciekłym azotem? Nie no wygłupiam się ale ciekawe ile to soczku żłopie z kontaktu bo na pewno nie miało.

  6. @5. (autor: TeXXaS | data: 28/08/13 | godz.: 16:18)
    "TDP nieco zmalało i wynosi 200W." :) sam proc...

  7. @kombajn4 (autor: Promilus | data: 28/08/13 | godz.: 17:13)
    A czym chłodzili 90nm 3 rdzeniowe 2 wątkowe pracujące na 3.2GHz proce? Albo te 4 rdzeniowe @ 5GHz? Masz zrypane odniesienie przez x86.

  8. @05 (autor: Plackator | data: 28/08/13 | godz.: 17:37)
    Powierzchnia jest duża, problemów z chłodzeniem nie powinno być

  9. poza tym (autor: Kosiarz | data: 28/08/13 | godz.: 18:46)
    moze miec wieksza tolerancje niz x86. Ciekawe ile Q3A wyplulby FPSow ;)

  10. @Kosiarz (autor: Promilus | data: 28/08/13 | godz.: 19:39)
    "moze miec wieksza tolerancje niz x86. Ciekawe ile Q3A wyplulby FPSow ;)"
    Niewiele, bo masz zilion rzeczy ograniczających prędkość renderingu (zresztą to jedna z wielu rzeczy, które załatwiał XreaL)


  11. Interesujące... (autor: Atak_Snajpera | data: 29/08/13 | godz.: 17:21)
    U Intela mamy np. 4C/8T a u IBM'a 12C/8T. Może mi ktoś wytłumaczyć ten ewenement?

  12. atak snajpera (autor: Aamitoza | data: 29/08/13 | godz.: 17:58)
    u intela masz 1 rdzeń 2 wątki, a u IBM 1 rdzeń i 8 wątków, a nie 12 rdzeni i 8 wątków.

  13. @Atak_Snajpera (autor: Wedelek | data: 29/08/13 | godz.: 18:06)
    Cytuję "Każdy rdzeń (...) jest w stanie obsłużyć jednocześnie do ośmiu wątków", co oznacza, że obsługiwanych jest 12*8= 96 wątków. Czterordzeniowy procesor Intela z rodziny Core obsługuje osiem wątków.

  14. Wracjąc do tego wydzielnia ciepła (autor: kombajn4 | data: 29/08/13 | godz.: 20:44)
    to to taki rdzeń obsługujący 8 wątków musi być nieporównanie bardziej skomplikowany od x86. Większy stopień komplikacji=więcej tranzystorów=więcej ciepła. Chociaż faktycznie 22nm powinny pomóc w tym departamencie. Jednak wydaje mi się (ekspertem od tego nie jestem, ale...) że jak na procesor serwerowy 200 W to nie lichy problem bo pewnie na jeden komp w klastrze przypadać będzie kilka takich procesorów. Z drugiej strony chyba nie ma na rynku niczego innego co by z jednego kawałka krzemu dawało 96 wątków. 8 takich procesorów to już co prawda 1600W ale aż 768 wątków. Robi wrażenie.

  15. up. (autor: piobzo | data: 30/08/13 | godz.: 00:55)
    tesla ma pewnie ze 100W więcej, i tak samo buduje się klastry, czyli raczej problemu nie będzie....

    w dobrze chłodzonych szafach nikomu takie tdp nie będzie przeszkadzać, w serwerowni i tak ludzi ryra, że hałas układu chłodzenia ma nawet 50db czy nawet 60,


  16. @kombajn4 (autor: Promilus | data: 30/08/13 | godz.: 09:31)
    "to to taki rdzeń obsługujący 8 wątków musi być nieporównanie bardziej skomplikowany od x86. Większy stopień komplikacji=więcej tranzystorów=więcej ciepła."
    Niespecjalnie, skoro sama arch. power nie potrzebuje aż tylu tranzystorów jako typowy RISC więc bez super opasłego dekodera rozkazów i shedulera, register rename itp. Nie potrzebuje. Zatem można się skupić na 2 rzeczach. Ilości wątków sprzętowych co wielkim problemem nie jest, bo jest potrzebny tylko switcher i odpowiednie mechanizmy zarzadzające - CMT czy HT w x86 to zasadniczo kilka % wiecej, a intel zrobił też HT 4 wątkowe do MIC. Wszelkie zapasy tranzystorów poszły w mega wielki cache, który z kolei nie jest aż tak prądożerny - ale wszystko zajmuje dużą powierzchnię.


    
D O D A J   K O M E N T A R Z
    

Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.