TwojePC.pl © 2001 - 2024
|
|
A R C H I W A L N A W I A D O M O Ś Ć |
|
|
|
Co zalecacie do sprawdzenia funkcjonowania LAN (ale nie ping). , Master/Pentium 31/10/11 10:29 Mam sieć gdzie notorycznie rozłącza mi połączenie z bazą i SSH (lokalnie). Podejrzewam, że któryś switch "zjada pakiety" ale ping wychodzi OK. Tj. tak twierdzą informatycy, ja jeszcze to potestuję w następnych dniach.
Jakie w miarę proste narzędzie testowania polecacie - końcówki i serwer są na Windows. Testowy serwer jest na linuksie ale w jego logach nie znalazłem nic istotnego.
Niestety nie mam dużego doświadczenia w diagnostyce sieci więc przydadzą się jakieś wskazówki.Nie ma tego złego , co by się w gorsze
obrócić nie mogło - jak nie wierzysz
włącz komputer :-) - hmm , Birdman 31/10/11 10:32
pathping, tracert - polecenia cmd
wireshark - programping? - jesli winda , elliot_pl 31/10/11 11:12
to to co Birdman podal. Dodatkowo pusc pingi ale o jakims sensownym rozmiarze, a nie domyslny (np. kolo 1000). Pod Linucham mozesz sie zabawic tcpdumpem no i rowniez wiresharkiem do diagnostyki.momtoronomyotypaldollyochagi... - kilka sposobow , RusH 31/10/11 12:06
po pierwsze logi tego SSH i bazy, co w nich siedzi? byly bledy czy timeout?
logi interfejsu sieciowego - rozlaczylo ? sieciowki maja sprzetowa korekcje? jak maja to zmienic (jak byla wlaczona to wylaczyc)
swicze zarzadzalne? kable dobrze zasisniete?
bylo dobrze i sie zwalilo czy cos niedawno bylo zmieniane ?
w logach zawsze cos jest, a jak nie ma to tak skonfiguruj aby cos zapisywalo (verbose)
aktywnie mozesz sie pobawic tcpping i udppingI fix shit
http://raszpl.blogspot.com/ - w logach stacji i serwera nie ma nic , Master/Pentium 31/10/11 16:40
sprzęt nie mój więc grzebanie w ustawieniach zostawiam na potem. Z braku błedach w logach sądzę że problem jest w switch'ach lub pomiędzy nimi.
Niestety sieć w tej firmie obsługuje jeszcze inna firma i chciałbym najpierw ustalić charakter usterki aby mnie spławili.
W logach Oracle brak informacji lub timeout'y połączeń z czego wnioskuję, że niektóre pakiety poprosty "znikają" po drodze.Nie ma tego złego , co by się w gorsze
obrócić nie mogło - jak nie wierzysz
włącz komputer :-) - na razie powalczę pingiem , Master/Pentium 31/10/11 16:42
z bardziej realistycznymi wielkościami niż domyślny.
Aha i miało być "NIE spławili" zamiast "spławili".Nie ma tego złego , co by się w gorsze
obrócić nie mogło - jak nie wierzysz
włącz komputer :-) - co do pinga - zwiększ parametry -n i -l , bwana 2/11/11 08:10
poza tym upewnij się, że faktycznie chodzi o problem z siecią, a nie z usługą (zakładam, że chodzi o bazę Oracle a właściwie o jej listenera).
Spróbuj wykonać w pętli także tnsping i zobacz, ile będziesz miał udanych a ile nieudanych prób. Jeśli będzie dużo błędów, wykonaj też tnsping z hosta, na którym uruchomiony jest listener. Jeśli liczba błędów spadnie, faktycznie chodzi o sieć, a nie o usługę.
Jeśli masz możliwość, sprawdź, czy listener bazy się nie restartuje samoczynnie (dziennik systemowy usług)."you don't need your smile when I cut
your throat" - a więc tak. , Master/Pentium 2/11/11 10:12
postawiłem drugi serwer testowy z OpenSuse i Oracle. Ilość rozłączeń WZROSŁA. Usługi Oracle są w porządku, nie restartują się ani nic w ten deseń. Na razie poprosiłem o przeniesienie serwera testowego poza serwerownię bo podejrzewam switch w serwerowni.
Pingiem powalczę później i prawdopodobnie przekaże problem ichnim sieciowcom (firma trzecia).Nie ma tego złego , co by się w gorsze
obrócić nie mogło - jak nie wierzysz
włącz komputer :-)
- zapusc iperfa , Tummi 1/11/11 08:49
i sprawdz wtedy, czy beda disconnekty ;)
T.www.skocz.pl/uptime :D - najpierw sprawdz telnetem. , ptoki 1/11/11 11:58
Czyli telnet na usluge (moze byc np starenkie echo albo netcat) chwile sobie poklep klawire i zostaw na chwile.
Po chwili znowu poklep i zobacz czy dalej dziala. W tym czasie zestaw sobie tcpdump-a.
A tak naprawde sprawdz czy przypadkiem ten putty do ssh nie ma ustawionego timeoutu. U mnie bez tego jest tak ze chwila nieklepania i nagle network caused disconnect (czy jakos tak).
W tcpdumpie bedziesz widzial czy jakis dziwny pakiet nie przylecial.
tcpdump -c 100000 -nn - s 0 -w /tmp/dump1- SSH nie ma ustanowionego timeout'u. , Master/Pentium 2/11/11 10:13
Zresztą wywaliło mnie w trakcie klepania poleceń :)Nie ma tego złego , co by się w gorsze
obrócić nie mogło - jak nie wierzysz
włącz komputer :-) - Oblukaj sobie "seconds between keepalives" , ptoki 2/11/11 11:04
Kiedys mialem 0 i sie sypalo, ustawilem na 25 i jest ok.
No i zweryfikuj czy problem jest sieciowy czy lokalny.
np. ssh lokalnie na adres zewnetrzny albo z serwera gdzies obok (zeby przez duzo switchy/routerow nie przechodzic).- to już poprzednio posprawdzałem , Master/Pentium 2/11/11 15:36
"seconds between keepalives" = 0 oznacza WYŁĄCZENIE keepalives i często skutkuje wysypywaniem nieaktywnej sesji przechodzącej przez jakieś routery. Lokalnie ten parametr nie jest potrzebny.
Połączenie wywala lokalnie bez żadnych routerów (przynajmniej ja o żadnych nie wiem) po drodze.Nie ma tego złego , co by się w gorsze
obrócić nie mogło - jak nie wierzysz
włącz komputer :-) - jest to replokowalne pomiedzy komputerami klienckimi? , ptoki 2/11/11 16:06
Moze link ethernetowy z przelacznika do serwera pada cyklicznie?
dmesg prawde powie.
Warto sprawdzic czy link jest ustawiony na auto czy na sztywno. Czasem u nas ustawienie na auto (czyli powinno dzialac na 100Mbit) robilo taki specyficzny flapping. Ustawienie na sztywno na 100 naprawialo sprawe.
Dodatkowo objaw byl taki ze kopiowanie wiekszych plikow szlo 20-30kb/sek...- w dmesg nic nie , Master/Pentium 2/11/11 17:28
sprawdzenie zacząłem od obadania logów systemowych i bazy.Nie ma tego złego , co by się w gorsze
obrócić nie mogło - jak nie wierzysz
włącz komputer :-)
|
|
|
|
|
All rights reserved ® Copyright and Design 2001-2024, TwojePC.PL |
|
|
|
|