freeze, standby o qualcosa di simile?? Help!

8 risposte [Ultimo messaggio]
Ritratto di ferdybassi
ferdybassi
(Guru)
Offline
Guru
Iscritto: 11/09/2005
Messaggi: 2668

Ciao a tutti.
Ho riciclato un vecchio Pentium II 350, 256 Mb di RAM come server della mia LAN di casa.
SUSE Prof. 9.3 fa egregiamente il suo lavoro:
- samba server
- web server
- mysql+PHP+tomcat
- mldonkey server

Non avendo spazio per altri monitor oltre che per quello della workstation, ho configurato il server SUSE per il login da remoto.
Lo posso fare con SSH, Telnet, VNC via web client o VNC. Inoltre ho installato Webmin e PHPMyAdmin per aiutarmi un po' nelle configurazioni e l'interfaccia web di mldonkey.
Tutto funziona bene, ma c'è un problema.

Dopo più o meno 14-16 ore, tutti i servizi da remoto diventano irraggiungibili e SUSE non risponde nemmeno ai ping.
All'inizio ho semplicemente pensato che si fosse piantato tutto (ebbene sì! soffro della sindrome da blue screen of death Wink... Così ho attaccato un monitor... e ho verificato che tutto è funzionante!!!
Tutti i servizi, tutti i demoni, tutte le interfacce web che ho installato, tutte le porte, da locale funzionano... ma la SUSE è chiusa nel suo mondo e non risponde ai ping (e alle altre sollecitazioni...) dall'esterno.

Ho pensato fosse saltata la scheda di rete, così ho riavviato per vedere se al boot la settava (L'ho impostata in Yast per essere attivata al boot time...).
Tutto ok, la scheda è riconosciuta e settata, e tutti i servizi dopo il riavvio magicamente funzionano da remoto...

Poi passano altre 14-16 ore e bum! Da locale tutto ok, da remoto "impossibile connettersi al server"...

Qualche idea??

Grazie mille!

Amministratore di
www.it-opensuse.org

Ritratto di SwatMc
SwatMc
(Monster)
Offline
Monster
Iscritto: 02/03/2005
Messaggi: 290

Ma è regolare 14-16 ore?
Mi vengono in mente 2 cose:
finisce le risorse (ram, principalmente)
hai un qualche problema hw sulla scheda che magari accumula corrente per 14-16 h, poi la scarica e non va più...

Prova a controllare la ram con free -m e, se non è particolarmente finita, prova a lasciarlo semplicemente acceso per una giornata (senza usarlo) per vedere se fisicamente tiene...

Questo è ciò che mi è venuto in mente, se qualcuno ha altre idee...

Ciao

Ritratto di ferdybassi
ferdybassi
(Guru)
Offline
Guru
Iscritto: 11/09/2005
Messaggi: 2668

Regolare 14-16 ore?
Mah, più o meno... Nel senso che lo faccio ripartire verso le 23.30, poi vado a letto, al mattino è ancora tutto ok, poi vado al lavoro, torno verso le 17.30 e ancora tutto va bene... poi verso le 19 succede quello che ho descritto... (ops, magari allora le ore sono anche 19-20...)

Non credo sia un problema di RAM, perchè quando il server si chiude in se stesso, se attacco un monitor riesco a loggarmi da locale, lanciare startx e farmi tutte le mie belle cosette col KDE... La ram mi sembra ok... cmq ora controllo...

Ho pensato anche io a un prob della scheda di rete, ma dove posso avere la conferma? C'è qualche file di log da tenere d'occhio?

Grazie a tutti!

Amministratore di
www.it-opensuse.org

Ritratto di ferdybassi
ferdybassi
(Guru)
Offline
Guru
Iscritto: 11/09/2005
Messaggi: 2668

Ah! Sono tornato adesso a casa, dopo averlo riavviato ieri mattina e non averlo più toccato. E' perciò passato un giorno e mezzo, ma lui ai ping non risponde, e ovviamente nessun servizio è raggiungibile da remoto...

Che faccio? Gli cambio la scheda di rete??
Ora provo a riavviarlo per l'ennesima volta...

Amministratore di
www.it-opensuse.org

Ritratto di roundrobin
roundrobin
(Monster)
Offline
Monster
Iscritto: 12/08/2005
Messaggi: 208

Prima di riavviare se puoi controlla i processi con

ps -aux

per vedere se qualcuno è [defunct]; controlla le schede di rete

ifconfig

leggi la fine di /var/messages o roba così. Nella lan c'è un host con dhcp attivo?

[=666666][=x-small]Ci sono 642 cose che devono accadere in sequenza; noi siamo solo alla numero 8
[/][/]

Ritratto di ferdybassi
ferdybassi
(Guru)
Offline
Guru
Iscritto: 11/09/2005
Messaggi: 2668

ps -aux : tutti i processi sembrano ben funzionanti. Non c'è nessun defunct

ifconfig: mi dà due risultati (ovviamente, avendo io una sola scheda di rete). eth0 e lo. eth0 è ben configurata, col giusto IP/Netmask, nessun error, nessun overrun. lo è inutile descriverlo, che tanto è il loopback

var/messages: ha solo due righe. La prima dice syslog new configuration initialized; la seconda mi dice "<nomehost> su: (to nobody) root on none"
Non so bene cosa voglia dire, ma credo abbia a che fare col fatto che mi sono loggato come root per lanciare i comandi di cui sopra...

Amministratore di
www.it-opensuse.org

Ritratto di ferdybassi
ferdybassi
(Guru)
Offline
Guru
Iscritto: 11/09/2005
Messaggi: 2668

Aggiunta al precedente messaggio.

Dopo aver riavviato il server, mi sono loggato da remoto al server mldonkey (http://<nomeserver>:4080) e ho iniziato a scaricare un paio di mp3.
Poi in locale sul server ho lanciato i comandi di cui riporto i risultati nel post precedente.
Poi sono ritornato in remoto su mldonkey e bum! Il server non risponde più ai ping e ad ogni tentativo di connessione remota.
Sul server il monitor è diventato nero (standby?)

Non è che tutto questo ha a che fare con una specie di standby che mi fa ibernare il tutto?

Amministratore di
www.it-opensuse.org

Ritratto di ferdybassi
ferdybassi
(Guru)
Offline
Guru
Iscritto: 11/09/2005
Messaggi: 2668

Ah! Dopo che i ping non funzionano più, se controllo ancora /var/log/messages, adesso ci sono circa un migliaio di righe che ripetono:

kernel: NETDEV WATCHDOG: eth0: transmit time out
kernel: transmit timed out. TXStatus 00 TXFrameID 00, resetting
kernel: 00 0bcca000 0bcca010 ... [cut 25 righe tutte simili]

e va avanti cosi. Ogni 10 secondi, /var/log/messages si aggiorna con queste 30 righe...

ifconfig adesso mi dice che eth0 ha TXPackets 9747, errors 05 dropped 2596

ps -aux insiste nel dirmi che tutti i processi sono attivi, e infatti da locale funziona tutto, apache, mldonkey, SSH, VNC, telnet

Nella rete c'è un DHCP server attivo (il router), ma non ci sono client dhcp (ce n'è uno quando mio cognato torna a casa nel week end e attacca il portatile, che ha configurato così per non fare casino con la rete del lavoro. Adesso però lui non c'è...)

Tutti i client sono Windows XP / 2k

Amministratore di
www.it-opensuse.org

Ritratto di SwatMc
SwatMc
(Monster)
Offline
Monster
Iscritto: 02/03/2005
Messaggi: 290

Non so cos'altro dirti... Se puoi, prova a cambiare scheda di rete...