Architektura Nvidia Blackwell i chip B200 oficjalnie zaprezentowane

M E N U

» Nowości

» Archiwum

» Recenzje / Testy

» Board

» Rejestracja

Szukaj @ TwojePC

Wtorek 19 marca 2024

Architektura Nvidia Blackwell i chip B200 oficjalnie zaprezentowane Autor: Zbyszek \| źródło: Nvidia \| 14:30	(16)
Nvidia oficjalnie zaprezentowała swoją nową architekturę GPU o nazwie kodowej Blackwell, oraz układ scalony B200 jaki znajdzie zastosowanie w nowych akceleratorach obliczeniowych przeznaczonych do zastosowania w serwerach. Układy graficzne z serii Blackwell będą wytwarzane w litografii TSMC 4nm, a konkretnie w procesie N4P w wersji specjalnie zoptymalizowanej dla Nvidia. W zakresie nowości przygotowanych dla kart GeForce informacje zostaną podane w późniejszym terminie, natomiast wersja serwerowa architektury Blackwell wprowadza budowę modułową, oraz nowe tryby FP6 i FP4 do obliczeń związanych ze sztuczną inteligencją. Pojedynczy układ scalony B200 zawiera 208 miliardów tranzystorów i jest zbudowany z dwóch identycznych umieszczonych obok siebie chipów krzemowych, które są połączone ze sobą interfejsem o szybkości 10 TB/s. Każdy z tych chipów zawiera po 104 miliardy tranzystorów oraz 160 bloków SM z łącznie 20480 rdzeniami CUDA. Daje to łącznie 40960 rdzeni CUDA w całym procesorze, a budujące go dwa chipy współpracują łącznie z ośmioma stosami pamięci HBM3 o łącznej pojemności 192 GB/s i przepustowości 8 TB/s. Dla porównania dotychczasowy układ krzemowy H100 (także wytwarzany w litografii 4nm) zawierał 80 miliardów tranzystorów oraz 132 bloki SM (łącznie 16896 rdzeni CUDA) i współpracował z 80 GB pamięci HBM3 o przepustowości 3,3 TB/s. W zakresie wydajności, Nvidia mówi, że B200 zaoferuje wydajność 2,5-krotnie wyższą niż H100, a w trybie FP4 około 5-krotnie wyższą niż H100. Wadą B200 na pewno będzie wysokie zużycie energii - z racji tego, że cały chip zawiera 2,6 razy więcej tranzystorów niż H100 a jest wytwarzany w tylko ulepszonej wersji tej samej 4nm litografii, mówi się że wersja PCIe będzie mieć wskaźnik TDP 700W, dwukrotnie wyższy niż H100 w wersji PCIe. Początkowo Nvidia oferować będzie karty serwerowe złożone z dwóch procesorów B200 oraz jednego Grace (CPU z architekturą ARM). W późniejszym czasie do oferty dołączą serwery DGX. Dokładne parametry urządzeń obliczeniowych z chipami B200 zostaną podane podczas ich premier, prawdopodobnie w 2. kwartale tego roku.

K O M E N T A R Z E

coś póżno się litografia 3nm przyjmuje (autor: Zbyszek.J | data: 19/03/24 | godz.: 22:38)
w 2 połowie 2024 będzie ponad 1,5 roku od pełnej gotowości i startu masowej produkcji 3nm w TSMC, a w tym procesie będą wtedy po 1,5 roku nadal powstawać tylko procesory do smartfonów i laptopów Apple. Ciekawe o co tu chodzi? bo narazie zarówno Nvidia jak i AMD omijają 3nm. Za droga litografia? Uzysk za mały? To drugie niemożliwe bo M3 Max ma około 500mm2 więc 3nm musi się nadawać do wytwarzania też dużych chipów.

A ten B200 to w dużym skrócie podwójny H100 na sterydach w 4nm na sterydach.
... Miały być 50% wydajniejsze w 3nm ale popyt na AI dyktuje wybór... (autor: SebaSTS | data: 19/03/24 | godz.: 23:35)
... procesu produkcji. W tym otoczeniu rynkowy, więcej chipów w tańszym sprawdzonym procesie znaczy lepiej dla nVidii.
@Seba (autor: Zbyszek.J | data: 20/03/24 | godz.: 00:06)
może i masz rację. Zrobili odświeżonego i 2 razy powiększonego kotleta, który będzie pobierał 2 razy więcej energii. Po co sprzedawać coś całkiem nowego jak można sprzedawać z grubsza to samo co teraz tylko powiększone i odświeżone
Zbyszek.J (autor: Markizy | data: 20/03/24 | godz.: 09:46)
prawdopodobnie jest problem zrobić tak wielki klocek aby chociaż pare sztuk było sprawnych.

Dziwi mnie pęd do tak wielkich monolitów jak zawsze było to mało opłacalne.
4-- (autor: Mario1978 | data: 20/03/24 | godz.: 17:16)
Najpierw powinieneś poczytać sobie, że B200 to dwa układy połączone szybką magistralą o przepustowości 10TB/s. To jest to sławetne N4X a czemu nazwali to 4NP to NVidia najlepiej wie. Gęstość upakowania tranzystorów poszła o 30% w górę. Na więcej danych poczekamy gdzie będą układy dostępne. Jeżeli to coś potrafi wciągnąć 2700W to N3X będzie pewnie z 5400W. Kto tam będzie się przejmował poborem energii w przypadku firm korzystających z tego ggy układ przynosi przynajmniej 250% wzrost wydajności a maksymalnie nawet 3000%. Potencjał rozwoju AI jest ogromny dlatego nie dziwi mnie, że w ciągu kolejnych 6 lat osiągniemy przynajmniej x1000 do wydajności AI. Te układy potrafią nawet grafikę generować w czasie rzeczywistym a z roku na rok będzie tylko lepiej i sporo większa moc. A piszemy przecież o krzemie, który powoli umiera. Są inne surowce i izotopy węgla, które są w stanie dać szkielet, który dodatkowo przyczyni się do zwiększenia wydajności spokojnie na poziomie x10 niż jest teraz. A Amerykańskie marki próbują jeszcze zarabiać kasę póki mają okazję. USA wie doskonale co ich czeka i skończy się Eldorado w narzucaniu ogromnych marż jakby firmy Amerykańskie były Instytucjami Lichwiarskimi.
Mario1978 (autor: Markizy | data: 20/03/24 | godz.: 17:49)
to przejrzyj się grafikom, widoczny jest tam monolit. W jednej strukturze krzemu masz dwa układy połączone wewnętrzną magistralą (pewnie łatwiej było ogarnąć logikę). Dzięki takiemu rozwiązaniu masz zalety takiego połączenia jak i wady. Przy tak dużym krzemie defekt eliminujący cały układ jest stosunkowo łatwo.
@up (autor: Conan Barbarian | data: 20/03/24 | godz.: 18:50)
To nie monolit a dwa kawałki krzemu "sklejone" perfekcyjnie. Tym sposobem możliwe było te 10TB/s.
@Mario1978 (autor: bmiluch | data: 21/03/24 | godz.: 08:59)
Co Ty tam za chińską chemię łykasz zanim zaczniesz pisać?
Postanowiłem pierwszy raz dokładniej przeczytać co tam piszesz. Założyłem czapeczkę z folii aluminiowej i ołowiane okularki.
Nie wnikam po co piszesz te peany na cześć CHRL. Pewnie dobrze płacą, albo masz jakąś wewnętrzną potrzebę. Ale o co chodzi z tymi izotopami węgla? Potrzebujesz C14 by określić za jakiś czas wiek układów scalonych? A może są jakieś ciekawe różnice fizyczne C14 i C13 w stosunk do C12?
@up (autor: Conan Barbarian | data: 21/03/24 | godz.: 22:04)
Może ludzie już mają dość demokracji w wydaniu USA?
Najlepsze jest jednak to, że te same qrwy, które teraz wyją w zachwycie na cześć USA będą pierwsze do chwalenia pod niebiosa reżimu rodem z ChRL.
8-- (autor: Mario1978 | data: 22/03/24 | godz.: 13:04)
Jakbyś był na tyle inteligentną osobą to byś odpowiedział zgodnie z tematem. Hipokrytów nie brakuje a ludzie zazwyczaj mylą się wobec innych ludzi gdy nie maja doświadczenia. Twoje myślenie jest o tyle błędne i tak bardzo jesteś ograniczony tym komu służysz, że w przeciwieństwie do ciebie ja nie jestem po żadnej ze stron. Dla mnie liczą się tylko korzyści, spokój, brak kłamstwa i manipulowani rzeczywistością. Ty jest podporządkowany jeden ze stron i od razu widać jakiej a ja nie jestem do żadnej podporządkowany bo jak już zszedłeś na ten temat to USA i Chiny mogą sobie podać dłoń gdy ogłaszały pandemię Covid, której nie było. Korupcja Covidowa jaka była z tym związana zostanie już na zawsze zapisania w dziejach historii ludzkiej i wiele osób w niej uczestniczyło. To ci ludzie co uwierzyli w tak zwane szczepionki dni życia mają szybciej liczone i przyczynili się do zadłużenia kraju. Ludzie poddając się temu napchali kieszenie tym co tym wszystkim dyrygowali. Dlatego już wiesz, w której części jesteś mocno ograniczony.
na temat? (autor: bmiluch | data: 22/03/24 | godz.: 13:39)
temat był następujący:Architektura Nvidia Blackwell i chip B200 oficjalnie zaprezentowane
czy pisałem na temat? nie - ale mi to specjalnie nie przeszkadza
jeżeli Ci to przeszkadza - sam pisz na temat, bo pisząć ciągle o Chinach zachowujesz się jak siostra zakonna, która nawet w zwierzątku z rudą kitą widzi Jezusa
11-- (autor: Mario1978 | data: 22/03/24 | godz.: 16:04)
I znów to samo. Insynuacje i pisanie bredni na czyiś temat. Skądś to znam. Wy już się nie ukryjecie czyje interesy reprezentujecie a to, że większość Polaków głosuje w Polsce na swoich oprawców nie znaczy, że wszyscy tak robią. Najpierw naucz się być kulturalny i mylić się na temat osoby, do której odpowiadasz. Polacy sami sobie winni, że ich kraj jest rozwalany od środka a robią to w imię interesów obcej nacji, która chce wszystkimi rządzić. Wam to powinni z urzędu dawać kolejne dawki Berbeluchy niby przeciw Covid żeby się nie zmarnowąły. Ale jak jesteś na tyle inteligentny to twoja Hipokryzja uniemożliwiła ci wzięcie czegoś co działa na twoją niekorzyść. Wyobraźnia ludzi ogranicza nie dlatego, że są ograniczeni ale dlatego, że sami się ograniczają. Są dane z przeszłości i jest teraźniejszość. NVidia robi swoje i bardzo dobrze, AMD też swoje robi chociaż jest ograniczane przez samo USA. Ale Stany Zjednoczone zrobiły błąd, które kosztować będzie jeszcze wielu ludzi życie. Tobie to nie przeszkadza bo ślepota ogarniania faktów ogólnie dostępnych gra na korzyść tych co ich wykorzystują. Będzie bardzo źle i to jest problem, który rozpoczął się w momencie Trumpowej polityki Zagrożenia Bezpieczeństwa ze strony Chin. Mi nie przeszkadza, że ludzie poświęcają się dla dobra obcej nacji bo to ich zdrowie i życie. Mi przeszkadza, że tak dużo tych ludzi jest. Ludzie myślą, że tu są dwa wybory a tak na prawdę są trzy bo nie trzeba wybierać żadnej ze stron i o tym zapomnieli.
Cerebras Systems WSE-3 (autor: pandy | data: 22/03/24 | godz.: 23:34)
4 tryliony tranzystorów, 44GB RAM na strukturze (na zewnątrz może być 1.2PetaByte) - 125Pflops - rozmiar struktury 215x215mm (powierzchnia 46225 mm2) i to nie jest sklejka... Przed NVidią długa droga...
to teraz (autor: pawel1207 | data: 26/03/24 | godz.: 23:47)
zostaje pogrzebac raytracing a generowaniem grafiki zajmie siei slinik ai bedziemy mieli super reealistyczna grafike wzglednie niskim kosztem zreszta gry na tekich silnikach beada powstawaly niskim kosztem w sumie mozna by zaprzac ai do generowania oswietlenia w grach zamiast rt bo narazie ai urzywa sie do bzdetow jak dlss i fg i denoising jak mozna by tym cala gre generowac no ale nie przy tym co mamy obecnie w kompach ale jesli software i hardware sie odpowidnio rozwinie a wszystko na to wskazuje ze tak bedzie to sie okarze ze to nie rt jest swietym gralem tylko ai ... z czasem programisci zaczna tracic robote no szykuja sie nam ciekawe czasy...
pandy (autor: pawel1207 | data: 26/03/24 | godz.: 23:56)
no nie dokonca dlatego ze to jest bardzo wyspecjalizowany chip jego przeznaczeniam jest trenowanie modeli ai i w zasadzie to tego sie ogranicza jego zastosowanie h100 czy b 200 to troche inna bajka ale fakt w swojej specjalizacji WSE-3 jest o niebo lepszy niz to co nvidia kiedykolwiek pokazala ..
@pawel1207 (autor: pandy | data: 30/03/24 | godz.: 14:12)
Chodziło mi o technologię i twierdzenia NVidii - te nie są prawdziwe. Układy NVidii też są wyspecjalizowane tylko mniejsze ale regularność bloków jest porównywalna i tu i tu.
Przede wszystkim Cerebrasowi udało się opanować ekonomicznie technologię WSI czyli coś co było od co najmniej 40 lat świętym Graalem elektroniki półprzewodnikowej - wyłożyło się na tym wielu wielkich elektroniki i informatyki.

D O D A J K O M E N T A R Z

Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.