Twoje PC  
Zarejestruj się na Twoje PC
TwojePC.pl | PC | Komputery, nowe technologie, recenzje, testy
M E N U
  0
 » Nowości
0
 » Archiwum
0
 » Recenzje / Testy
0
 » Board
0
 » Rejestracja
0
0
 
Szukaj @ TwojePC
 

w Newsach i na Boardzie
 
TwojePC.pl © 2001 - 2024
Poniedziałek 5 czerwca 2023 
    

Nietypowy problem unieruchamia procesory EPYC 2. generacji


Autor: Zbyszek | źródło: TechPowerUp | 16:08
(8)
W ostatnim czasie odkryty został nietypowy problem procesorów serwerowych AMD EPYC 2. generacji (nazwa kodowa Rome). Procesory te zadebiutowały na rynku w 2. połowie 2019 roku, i musiało upłynąć trochę czasu, aby okazało się, że cierpią one na nietypową przypadłość. Problem został zgłoszony do AMD przez co najmniej kilku posiadaczy serwerów z tymi procesorami, którzy raportowali wyłączenie się procesorów w serwerach nie restartowanych nigdy od około 3 lat, przy czym restart serwera całkowicie eliminuje problem i przywraca jego pełną sprawność. Jak się okazało, przyczyną problemu jest licznik CPU REFCLK powiązany z funkcją przechodzenia rdzeni w tryb uśpienia CC6.

Licznik CPU REFCLK odlicza co 10 ms, i przepełnia się po 1042 dniach i 12 godzinach ciągłego, nieprzerwanego działania procesorów EPYC 2. generacji - w efekcie powodując przejście rdzeni w tryb uśpienia CC6 na stałe. Wystarczy jednak zrestartować serwer a tym samym procesor, aby licznik CPU REFCLK znów odliczał od początku, a procesor działał w pełni ponownie.

Błąd nie powinien mieć miejsca, jednak z drugiej strony ciągła praca serwera przez okres prawie 3 lat, bez żadnej przerwy serwisowej na wgranie koniecznych aktualizacji bezpieczeństwa i innych poprawek, nie jest zbyt częstą praktyką. Na razie nie wiadomo jeszcze, czy AMD przygotuje poprawkę eliminującą nietypowy problem swoich procesorów.

 
    
K O M E N T A R Z E
    

  1. dziwne (autor: Markizy | data: 5/06/23 | godz.: 20:45)
    niedopatrzenie ze strony amd, przy serwerach trzeba założyć raczej ciągłą pracę bez restartów lub uśpienia. Chociaż z drugiej strony nie jest to rzadkie, esp32 ma taki timer na 60 dni (około) i przed tym czasem układ trzeba zrestartować.

  2. CPU REFCLK (autor: Conan Barbarian | data: 5/06/23 | godz.: 22:15)
    To popierdółka jest tylko - u Majów cały kalendarz się skończył i jakoś dało się pociągnąć dalej.
    Widocznie AMD uznało, że takie 3-letnie proce już dawno powinny być wymienione na nowe, bardziej zielone, szczególnie w pedałującej Europie.


  3. trzy lata bez restartów ? (autor: VP11 | data: 6/06/23 | godz.: 09:01)
    Bez latek i innych rzeczy ciągła praca?

    U Intela VROK już po tygodniu pracy zaczyna sobie na full zabierać jeden rdzeń, i wszytko Ok. Aby nie mieć straty wydajności trzeba co tydzień restartować komputer. Co tydzień !!! Trzy lata bez restartu to pikuś.


  4. ... (autor: power | data: 6/06/23 | godz.: 13:51)
    W obecnych czasach raczej jest malo prawdopodobne zeby PC czy nawet serwer pracowal non stop przez 3 lata.
    Oprocz restartow zwiazanych z aktualizacjami potrzebne sa tez okresowe przeglady sprzetu, czyszczenie itp.
    Kolejna kwestia to oplacalnosc uzywania starych CPU, gdy wchodza nowsze wydajniejsze i bardziej energooszczedne modele.


  5. power (autor: Markizy | data: 6/06/23 | godz.: 16:56)
    super komputerów nikt tak często nie modernizuje. A ty zakładasz że firma wymieniać będzie serwery jeśli pojawi się tylko nowa generacja procesorów?

  6. Błędy się zdarzają (autor: kombajn4 | data: 6/06/23 | godz.: 19:50)
    Pytanie co z nim zrobią. O ile da się to zwykła aktualizacją załatwić...
    Tak swoją droga 3 lata nieprzerwanej pracy - szacun. Kiedyś na studiach mieliśmy spotkanie z chłopem z Motoroli i opowiadał jak wygląda kwestia niezawodności sprzętu krytycznego - np central telefonicznych (każde wyłączenie to jakiś okres w którym np nikt na danym obszarze nie zadzwoni po karetkę w razie potrzeby itp) - zakłada się tam możliwość przerwania pracy przez 4 minuty rocznie. No a tu mamy sytuację że sprzęt bez zacięcia pracował 3 lata. I to nie w jednej firmie a w wielu.


  7. Swoją drogą (autor: pandy | data: 6/06/23 | godz.: 22:34)
    Aż dziwne - wydawało mi się że dynamiczna podmiana kodu to standard w poważnych zastosowaniach...

  8. @Markizy (autor: Promilus | data: 9/06/23 | godz.: 06:02)
    Serwery też się restartuje ;) Oczywiście nie wszystkie węzły naraz, ale jednak.

    
D O D A J   K O M E N T A R Z
    

Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.