TwojePC.pl © 2001 - 2024
|
|
A R C H I W A L N A W I A D O M O Ś Ć |
|
|
|
Błędy na dysku przy uruchamianiu nowych komputerów , JOTEM 25/04/22 16:28 Witam,
Mam dziwną sytuację. Może coś źle robimy, ale nie wiem co można źle zrobić w tak prostym procesie.
Mamy do zainstalowania kilkadziesiąt komputerów - przyjacielska usługa. Wszystkie to systemy NUC 10i3FNB przerabiane przez jakąś niemiecką firmę i dostarczane przez nią z dyskami, pamięcią i preinstalowanym windowsem. Pamięci są na liście intela z informacją "Intel validated". Dyski to WD blue (bleeee) sn570.
Ze względu na ilość i konieczność zainstalowania dodatkowego softu komputery są powielane z pierwszego egzemplarza, czyli wszystkie mają identyczny software. Komputery całkowicie zaktualizowane i aktualizacje po tym procesie wyłączone.
Problem - co 3 komputer po powieleniu systemu ma katastrofalne błędy w systemie plików (sprawdzane chkdsk z pendrive). Naprawianie bardzo kłopotliwe. Powtórne powielenie czasem pomaga, czasem nie.
Gorzej. Komputer po odstaniu chwili potrafi wstać bez błędów i chkdsk już żadnych błędów nie widzi ??? Pamięci Microna sprawdzone długim memtestem. Brak błędów.
Podwójnie gorzej, niektóre z tych uszkodzonych co same "zmartwychwstały" w cudowny sposób, mają skłonnośc do gaszenia ekranu...tak pochodzi sobie i mrugnie na czarno...pochodzi i zgaśnie na kilka sekund...pochodzi i mrugnie. A potem po ponownym restarcie znowu błędy na dysku i brak bootowania do systemu.
Jakby to był jeden komputer to ok...wadliwy. Ale kilkanaście na kilkadziesiat!!??
W wielu przypadkach pomogło wyjęcie i włożenie dysku...w innych nie.
Wszystko nowe "dziewicze komputery". Kadłubki od intela, czyli nie ostatnie dno.
Dyski NVMe wadliwe/niekompatybilne?? Ktoś coś o tym słyszał/zauważył? Sobie bym WD blue nie kupił, za dużo takich talerzowych wyrzuciłem. Tu zostały narzucone odgórnie. Na liście kompatybilnych NVMe intela ich nie ma - żadnych blue nie ma, tylko black.
Monitory testowane różne. W biosie jakby nie mrugały.
Jakieś pomysły? Będę wdzięczny za każdy pomysł.
PozdrawiamPoryjemy..zrobaczymy - klon na dysk zgodny np Black , Artaa 25/04/22 17:44
i przetestować na wszystkich opornych sztukach NUC
jak będzie dobrze to ... ;-) - W jaki sposób klonujecie dyski? , off 26/04/22 07:45
Używacie sysprepa do przygotowania systemu?
Używacie DISM? Czym powielacie nośniki?Born to be born. - Robimy kopię bezpieczeństwa , JOTEM 26/04/22 09:38
całego dysku za pomocą EaseUS Todo Backup (narzucony odgórnie). Kopię robimy sektor po sektorze lub plikowo - bez wynikowej różnicy - z oprogramowania startującego z pendrive.
Wcześniej powieliliśmy tą metodą kilkadziesiąt (~50) stacji AllInOne beż żadnego problemu. Proces powielenia trwa około 12 minut z pendrive. Oprogramowanie, które instalujemy wymaga dokładnej konfiguracji, instalacji i konfiguracji dodatkowych kodeków, ustawień systemowych oszczędzania energii itp. Razem to godzina instalacji. Windowsy po kopiowaniu aktywują się bez problemu i na wszystkich komputerach allInOne pracowały bez problemu. Na NUCach co trzeci dostaje pier...ca. Błędy są i znikają i to wyłaczanie ekranu - losowo bez żadnych śladów w logach systemowych.
Różnica jest taka, że na komputerach AllInOne był Windows Enterprise LTSC, na NUCach jest professional.
Problemy po powieleniu są zazwyczaj takie, że windows przestaje bootować. Jedyna opcja to bootowanie z osobnego nośnika. Duże ilości błędów w strukturze plików, w tym właśnie plików związanych z procesem bootowania. Co istotne, tak jak wspominałem - następuje czasem cudowne ozdrowienie. Systemy, w którym chkdsk odpalony z pendrive pokazywał błędy, po ponownym restarcie z tego samego pendrive już błędów nie pokazuje i pracuje poprawnie lub pracuje gasząc losowo ekran (???) ale bez błędów na dysku.
Zaraz zaczynamy przekładanie dysków twardych z całymi systemami z tych co dobrze działają do tych zdziczałych - zobaczymy.Poryjemy..zrobaczymy - Skoro macie przetestowaną metodę, , off 26/04/22 10:44
to rzeczywiście może to być problem sprzętowy.
Wszystkie dyski mają taką samą wersję firmware oraz hardware?
Osobiście miałem podobny problem. Po wersji fw udało się odsiać wadliwe, nowe dyski.
Diagnostycznie można spróbować postawić świeży OS na podejrzanej maszynie.Born to be born. - ... , pwil2 26/04/22 20:01
Problemy z ekranem przy iGPU sugerują wadliwe lub niekompatybilne pamięci. Miałem kiedyś A-Daty, które na połowie płyt (wtedy miałem 100% Intela) nie działały stabilnie, niezależnie od taktowania, napięć, tego czy wsadziłem dowolny 1 lub 4 moduły. MemTest 100% ok.
Sprawdź windowsowego MemTesta chociaż kilka przejść na kilku komputerach.7800X3D/64G ECC/6800 7840HS/96G
5600H/64G/3060 5650G/128G ECC
1350P/64G 13700 SSD_30T A7m3 - Pamięci na najgorszej sztuce przeszly test , JOTEM 26/04/22 20:39
Całonocny, klasycznym memtestem86. Żadnych błędów. Model pamięci, jak pisałem, weryfikowany przez Intela. mieliśmy jużwielokrotnie problemy z instalacją systemów przez wadliwe pamięci, więc je w pierwszej kolejności sprawdziliśmy.
Co do mrugania, to nieco absurdalnie - bezpośrednim powodem wydaje się być...przejściówka HDMI-DVI. Na dwóch monitorach podłaczonych z przejściówką mruga. Na dwóch monitorach bez przejściówki - nie mruga. Niby jasne, tylko czemu mruga tylko na tych komputerach, które mają jednocześnie problemy z dyskami??? Pozostałe (ponad dwie trzecie) nie mrugają i z przejściówkami i bez.Poryjemy..zrobaczymy
- Obstawiam problem sprzętowy , ligand17 26/04/22 19:37
może dyski/pamięci źle zamontowane? Może problemy z przegrzewaniem któregoś układu? A może po prostu walnięta jakaś seria płyt/dysków/pamięci - spróbujcie sprawdzić po numerach seryjnych, czy nie ma jakichś prawidłowości.- Sam się zastanawiam co do przegrzewania , JOTEM 26/04/22 20:45
Sn570 256 MB ma tylko jedną kość pamięci. Fabryczne chłodzenie w NUCu (termopad) obejmuje tylko kawałek tej kości (~20%) i kawałek kontrolera. Może przy intensywnej pracy podczas powielania coś się z tym dzieje...Spróbujemy poprawić ułożenie termopadów.Poryjemy..zrobaczymy - Sprawdziliśmy grzanie , JOTEM 27/04/22 15:56
po 30 minutach obciążenia testami dysku temperatura wskazywana przez program WD - 41 stopni. Raczej się nie grzeje.Poryjemy..zrobaczymy
- ... , pwil2 26/04/22 19:50
Generalnie SSDki WD Blue SN550 ("V1") i SN570 to całkiem niezłe nośniki.
Niekompatybilność może się zdarzyć. Miałem ze 3 modele SSDków, które miały problemy na niektórych platformach (wtedy miałem tylko Intela).
Miałem przypadek na laptopie z prockiem Intela, że Windows po instalacji łatek na Meltdown&Spectre się rozjeżdżał. Miałem na szczęście zrobionego klona tuż przed ostateczną instalacją aktualizacji i powtórzyłem kilka razy z tym samym efektem.7800X3D/64G ECC/6800 7840HS/96G
5600H/64G/3060 5650G/128G ECC
1350P/64G 13700 SSD_30T A7m3 - ... , pwil2 26/04/22 19:51
Sklonuj na SSD i zrób z tego od razu obraz, ze 2x z rzędu. Sprawdź, czy wszystkie 3 będą miały te same sumy kontrolne.7800X3D/64G ECC/6800 7840HS/96G
5600H/64G/3060 5650G/128G ECC
1350P/64G 13700 SSD_30T A7m3 - c.d. , pwil2 26/04/22 19:56
powtórz na jakimś problemowym SSD. Miałem kiedyś tak, że zapisując duże archiwa mostek południowy ICHx się przegrzewał i przekłamywał dosłownie kilka bitów na każdy GB danych zapisanych. Archiwa 10GB były czytelne, ale np. 50GB już nie.7800X3D/64G ECC/6800 7840HS/96G
5600H/64G/3060 5650G/128G ECC
1350P/64G 13700 SSD_30T A7m3 - c.d. , pwil2 26/04/22 19:58
Z tego co pamiętam to taki Macrium Reflect ma przy klonowaniu opcję weryfikacji zapisu.7800X3D/64G ECC/6800 7840HS/96G
5600H/64G/3060 5650G/128G ECC
1350P/64G 13700 SSD_30T A7m3 - Właczyliśmy teraz weryfikację , JOTEM 27/04/22 15:55
dodatkowo jak napisałem na dole, zrobimy dwie kopie bez restartu i porównamy.Poryjemy..zrobaczymy
- Aktualizacja , JOTEM 26/04/22 21:16
Sprawa pierwsza. Okazało się, że dostawca nie dał tych samych dysków we wszystkich komputerach. W 25% dał tanie dyski NVMe Samsunga. Żaden z dysków Samsunga nie wykazuje problemów przy pracy. Wszystkie co do jednego przy pierwszym starcie powielonego systemu zgłaszają co prawda konieczność naprawy dysku, startujący system naprawia jednak dyski sam, trwa to koło sekundy i potem żadnych problemów. Na żadnym samsungu nie było potem żadnych problemów. Do każdej stacji jest prowadzona dokumentacja i stąd wiemy, że każdy z samsungów się tak samo zachowywał i żaden nie zgłaszał żadnych późniejszych problemów. Problemy dotyczą tylko WD. Wcześniej nie wiedziałem o różnych dyskach, bo każdy komputer z problemami rozkręcałem osobiście, poprawiałem ułożenie dysku i stąd wiem naocznie, że wszystkie problemowe były z WD. Innych nie otwierałem...
Może istotne jest, że tak się złożyło, że oryginalny obraz pochodzi z samsunga, a powielany jest na WD??
A teraz najlepsze. Wczoraj przez cały dzień była walka, ciągłe problemy z bootowaniem, ciągłe wykrywania błędów na dyskach. Co ważne - na żadnym z wczorajszych problematycznych dysków nie były wykonane żadne naprawy struktury plików. Żadne! Chkdsk w trybie read only! A dzisiaj - cały dzień testów i żaden z wczorajszych i dzisiejszych komputerów nie miał problemów z bootowaniem. Żaden nie wykazywał błędów na dysku w testach. Przez cały dzień. Cudowna samonaprawa tylu dysków. Wystraszyły się???? Pozostało mruganie monitorów podłączonych przez przejsciówki DVI-HDMI ale dyski w całkowitym porządku.
Promieniowanie kosmiczne....inna temperatura, wilgotność?? cud??
Kociokwiku dostajemy...
Już się modlić zacząłem, żeby w końcu któryś znowu odmówił pracy i ... nic.
Nie można tego oddać dalej bez ustalenia powodu, bo jak nagle przestały, tak nagle znowu zaczną sypać błędami.
Dodatkowo sprawadzone - wszystkie dyski ten sam firmware. Na jutro jeszcze testy przegrzewania zaplanowane. Sprawdzimy też, jak tu sugerowano, kolejność numerów seryjnych.
Sporo NUCów instalowaliśmy, ale zawsze sami je obsadzaliśmy pamięciami i dyskami. Nigdy nie było problemów, poza jednym przypadkiem NUCa w wersji performance i jego problemów z działaniem konwerterów FTDI na USB w podłączanych urządzeniach (winna okazała się usługa intela do oprogramowania zarządzającego procesorem). To pierwsze komputery NUC z takimi problemami.
Poryjemy..zrobaczymy - napiszę to co poprzednio , Artaa 27/04/22 10:11
tylko już pewniej ;-)
wygląda na niezgodność z WD blue i wychodzi to przy klonowaniu
ale jak się naprawiło to pewnie będzie już działać...- a te WDki różnią się technologią cache'u w stosunku do Samsunga? , Grocal 27/04/22 11:05
Generalnie podobne "jazdy" mam w mojej konfiguracji, gdzie korzystam z małego dysku SSD do keszowania dużego dysku talerzowego. Czasami po aktualizacji gry na Steam wyskakuje CRC error w Steamie i trzeba wymusić sprawdzenie plików jeszcze raz. Po wyłączeniu cache'u - nic takiego się nie zdarza. Jak dla mnie te WD Blue mają problem ze swoim cache'owaniem. Możliwe, że to się automatycznie naprawia, bo dane się w końcu odświeżają na poprawne.Na pewno, na razie, w ogóle...
Naprawdę, naprzeciwko, stąd...
Ortografia nie gryzie! - one są DRAMLESS , Master/Pentium 27/04/22 12:16
może szwankuje cachowanie z użyciem OS'a?
https://www.tomshardware.com/...-blue-sn570-reviewNie ma tego złego , co by się w gorsze
obrócić nie mogło - jak nie wierzysz
włącz komputer :-) - a to może tym bardziej , Grocal 27/04/22 13:23
np. przy nagrywaniu obrazów na te WDki uzupełnia się też cache SLC a potem de facto są tam śmieci, dopóki nie zaczną się nadpisywać poprawnymi danymi z TLC. Ale to by był błąd firmware'u/kontrolera raczej.Na pewno, na razie, w ogóle...
Naprawdę, naprzeciwko, stąd...
Ortografia nie gryzie!
- A spróbuj jeszcze , ligand17 27/04/22 10:26
zainstalować na którymś z tych feralnych PCtów tego Windowsa od zera. Ciekaw jestem, czy też będą takie kwiatki?- Na siedmiu zrobionych z instalacją od zera żadnych błędów , JOTEM 27/04/22 15:54
Teraz robimy kopię z komputera z WD zainstalowanego od zera. Zrobimy dwie kopie bez restartu komputera i porównamy zawartość.Poryjemy..zrobaczymy - Heh , ligand17 27/04/22 21:28
czyli jakby ten obraz, którego używaliście do tej pory był coś nie teges - jakieś inne sterowniki albo coś w tym stylu? Że przy instalacji od zera z pendrive'a inaczej sobie instaluje/konfiguruje sprzęt?
- Co do magicznej samonaprawy partycji , Soulburner 27/04/22 07:34
to NTFS od jakiegoś czasu (Vista albo 7, nie pamiętam) ma zdolność samonaprawy właśnie (bardziej precyzyjnie: system potrafi uruchomić korektę systemu plików w tle, bez konieczności odmontowywania woluminu). To wyjaśnia magiczną naprawę partycji na następny dzień, bo wystarczy kilka chwil działania Windowsa (jeśli tylko stan partycji pozwoli systemowi wstać), aby błędy zostały naprawione, bez konieczności skanowania całego systemu plików.You must gather your party before
venturing forth. - Dobrze wiedzieć , JOTEM 27/04/22 15:52
Tutaj niestety wielokrotnie było tak, że błędy były - komputer nie bootował. Testy z pendrive wykazują kolosalną ilość błędów na dysku. Zostawiony jakiś czas bez naprawiania zaczyna startować. Te same testy z pendrive już błędów nie pokazują. Znowu zostawiony, uruchomiony po godzinie i znowu nie bootuje. Znowu błędy na dysku. Nie zrobiliśmy niestety ani razu zdjęcia ekranu, żeby porównać, czy błędy są dokładnie takie same. To się potrafiło 3 razy w cyklu powtórzyć. A teraz jak pisałem wszystkie od 36 godzin startują bez błędów.Poryjemy..zrobaczymy
- Użyjcie innych dysków SSD , Majster 27/04/22 17:50
Spróbujcie zmontować ze 4 komputery z innymi SSD... przykładowo weźcie Samsungi 970 Pro lub 980 Pro i wtedy sprawdźcie. Dyski te będą droższe w zakupie, więc automatycznie musicie przekroczyć budżet przy składaniu tych kilkudziesięciu komputerów, ale myślę, że jednak warto.
Tutaj masz mój screen z SSD Samsung 860 Evo:
https://www.imagevenue.com/ME14RJ13
https://www.imagevenue.com/ME14RJ31
Albo sprawdźcie dokładnie tego pendrive'a, z którego robicie kolejne instalacje systemów, bo być może z nim jest coś nie tak. Jeśli nie, to możecie wypróbować inny sposób - zamiast instalować z USB 3.0 lepiej użyć USB 2.0. Niektóre płyty główne bywają kapryśne i jeżeli instalacja systemu z USB 3.0 nie przechodzi jak trzeba, należy użyć USB 2.0."Żone mam tylko przy wypłacie, reszta żyje w celibacie" - R. Górski. - testowo bym parę kopii zrobił innym softem np darmową wersją macrium reflect... , DrLamok 27/04/22 19:46
z tego samego samsunga na powieedzmy 5 sztuk WD
kopia inteligentna (nie po sektorach) i włączony w opcjach trim po odzysku na WD...
po odzysku dysk zostawić w spokoju na jakiś czas...
|
|
|
|
|
All rights reserved ® Copyright and Design 2001-2024, TwojePC.PL |
|
|
|
|