Procesory AMD z architekturą ZEN mają ukrytą obsługę instrukcji FMA4
Autor: Zbyszek | źródło: TechPowerUp | 11:25
(4)
Instrukcje FMA4 to opracowany przez AMD zestaw rozkazów przyspieszający wykonywanie operacji jednoczesnego dodawania i mnożenia na czterech operandach (np. a = b + c *d). Instrukcje zadebiutowały wraz z architekturą Bulldozer, a następnie były stosowane w jej kolejnych odmianach takich jak Piledriver, Steamroller i Excavator. Począwszy od Piledrivera dodano także instrukcje FMA3 do jednoczesnego dodawania i mnożenia na trzech operandach (np. a = b + c *a). Konkurencyjny Intel nigdy nie dodał do swoich procesorów FMA4, poprzestając na obsłudze FMA3, która pojawiła się w 2013 roku w architekturze Haswell.
Instrukcje FMA4 nie pojawiły się także w opracowanej od nowa architekturze ZEN, i z tego powodu myślano, że AMD zrezygnowalo z dalszej obsługi tego zestawu. Tymczasem w serwisie YouTube na kanale Level1Tech pojawiło się nagranie, które dowodzi, że obsługa tych instrukcji w architekturze ZEN nadal istnieje, i jest po prostu ukryta. Odkrycie tego było możliwe przy wykorzystaniu bibliotek matematycznych OpenBLAS z wykorzystaniem FMA4. Biblioteki przy wykonywaniu instrukcji zwracały komunikat „illegal instruction”, ale równocześnie także prawidłowe wyniki, co oznacza, że FMA4 funkcjonuje.
Co więcej czas obliczeń uzyskany przy użyciu FMA4 porowónano do czasu obliczeń przy korzystaniu z instrukcji AVX i jak się okazało, FMA4 było w każdym z testów po prostu wydajniejsze.
K O M E N T A R Z E
:-) (autor: pwil2 | data: 16/10/18 | godz.: 12:24) U AMD ukrytym bonusem są dodatkowe instrukcje zwiększające wydajność. U Intela ukrytym bonusem są co najwyżej instrukcje zwiększające podatności ;-)
Tak się tego wstydzili, ze (autor: Sony Vaio VPN | data: 16/10/18 | godz.: 12:40) Aż ukryli. Takie to było dobre.