TwojePC.pl © 2001 - 2024
|
|
Poniedziałek 5 czerwca 2023 |
|
|
|
Nietypowy problem unieruchamia procesory EPYC 2. generacji Autor: Zbyszek | źródło: TechPowerUp | 16:08 |
(8) | W ostatnim czasie odkryty został nietypowy problem procesorów serwerowych AMD EPYC 2. generacji (nazwa kodowa Rome). Procesory te zadebiutowały na rynku w 2. połowie 2019 roku, i musiało upłynąć trochę czasu, aby okazało się, że cierpią one na nietypową przypadłość. Problem został zgłoszony do AMD przez co najmniej kilku posiadaczy serwerów z tymi procesorami, którzy raportowali wyłączenie się procesorów w serwerach nie restartowanych nigdy od około 3 lat, przy czym restart serwera całkowicie eliminuje problem i przywraca jego pełną sprawność. Jak się okazało, przyczyną problemu jest licznik CPU REFCLK powiązany z funkcją przechodzenia rdzeni w tryb uśpienia CC6.
Licznik CPU REFCLK odlicza co 10 ms, i przepełnia się po 1042 dniach i 12 godzinach ciągłego, nieprzerwanego działania procesorów EPYC 2. generacji - w efekcie powodując przejście rdzeni w tryb uśpienia CC6 na stałe. Wystarczy jednak zrestartować serwer a tym samym procesor, aby licznik CPU REFCLK znów odliczał od początku, a procesor działał w pełni ponownie.
Błąd nie powinien mieć miejsca, jednak z drugiej strony ciągła praca serwera przez okres prawie 3 lat, bez żadnej przerwy serwisowej na wgranie koniecznych aktualizacji bezpieczeństwa i innych poprawek, nie jest zbyt częstą praktyką. Na razie nie wiadomo jeszcze, czy AMD przygotuje poprawkę eliminującą nietypowy problem swoich procesorów. |
| |
|
|
|
|
|
|
|
|
|
K O M E N T A R Z E |
|
|
|
- dziwne (autor: Markizy | data: 5/06/23 | godz.: 20:45)
niedopatrzenie ze strony amd, przy serwerach trzeba założyć raczej ciągłą pracę bez restartów lub uśpienia. Chociaż z drugiej strony nie jest to rzadkie, esp32 ma taki timer na 60 dni (około) i przed tym czasem układ trzeba zrestartować.
- CPU REFCLK (autor: Conan Barbarian | data: 5/06/23 | godz.: 22:15)
To popierdółka jest tylko - u Majów cały kalendarz się skończył i jakoś dało się pociągnąć dalej.
Widocznie AMD uznało, że takie 3-letnie proce już dawno powinny być wymienione na nowe, bardziej zielone, szczególnie w pedałującej Europie.
- trzy lata bez restartów ? (autor: VP11 | data: 6/06/23 | godz.: 09:01)
Bez latek i innych rzeczy ciągła praca?
U Intela VROK już po tygodniu pracy zaczyna sobie na full zabierać jeden rdzeń, i wszytko Ok. Aby nie mieć straty wydajności trzeba co tydzień restartować komputer. Co tydzień !!! Trzy lata bez restartu to pikuś.
- ... (autor: power | data: 6/06/23 | godz.: 13:51)
W obecnych czasach raczej jest malo prawdopodobne zeby PC czy nawet serwer pracowal non stop przez 3 lata.
Oprocz restartow zwiazanych z aktualizacjami potrzebne sa tez okresowe przeglady sprzetu, czyszczenie itp.
Kolejna kwestia to oplacalnosc uzywania starych CPU, gdy wchodza nowsze wydajniejsze i bardziej energooszczedne modele.
- power (autor: Markizy | data: 6/06/23 | godz.: 16:56)
super komputerów nikt tak często nie modernizuje. A ty zakładasz że firma wymieniać będzie serwery jeśli pojawi się tylko nowa generacja procesorów?
- Błędy się zdarzają (autor: kombajn4 | data: 6/06/23 | godz.: 19:50)
Pytanie co z nim zrobią. O ile da się to zwykła aktualizacją załatwić...
Tak swoją droga 3 lata nieprzerwanej pracy - szacun. Kiedyś na studiach mieliśmy spotkanie z chłopem z Motoroli i opowiadał jak wygląda kwestia niezawodności sprzętu krytycznego - np central telefonicznych (każde wyłączenie to jakiś okres w którym np nikt na danym obszarze nie zadzwoni po karetkę w razie potrzeby itp) - zakłada się tam możliwość przerwania pracy przez 4 minuty rocznie. No a tu mamy sytuację że sprzęt bez zacięcia pracował 3 lata. I to nie w jednej firmie a w wielu.
- Swoją drogą (autor: pandy | data: 6/06/23 | godz.: 22:34)
Aż dziwne - wydawało mi się że dynamiczna podmiana kodu to standard w poważnych zastosowaniach...
- @Markizy (autor: Promilus | data: 9/06/23 | godz.: 06:02)
Serwery też się restartuje ;) Oczywiście nie wszystkie węzły naraz, ale jednak.
|
|
|
|
|
|
|
|
|
D O D A J K O M E N T A R Z |
|
|
|
Aby dodawać komentarze, należy się wpierw zarejestrować, ewentualnie jeśli posiadasz już swoje konto, należy się zalogować.
|
|
|
|
|
|
|
|
|
|