Dopo aver avuto il server down per 3 giorni, è finalmente tornato tutto alla normalità.
Sostanzialmente, essendo un RPS, il server perdeva la comunicazione con il SAN OVH, Storage Area Network, rimanendo quindi online, ma nell’impossibilità di eseguire qualsiasi operazione di lettura/scrittura dati.
Ho aperto un ticket con priorità critica, ed a parte le 12 ore di ritardo alle già 12 previste per una risposta al ticket di questa priorità mi è stato detto, come al solito di provare a riavviare e controllare i log.
Ora, anche un totale inetto avrebbe capito che senza hard drive i log non possono venir scritti, ma loro no continuavano col dirmi che sicuramente non c’erano problemi di SAN di riavviare e controllare i log.
Ora, ho riavviato ed eseguito tutti i test (ovviamente il test sulla partizione /dev/sda2 falliva nonostante loro dicessero che era tutto apposto), ho controllato i log ed in effetti, casualmente i log si fermano al 13/09 e ripartono il 16/09, data del reboot:
1 2 | Sep 13 05:36:02 saturn kernel: IPv6 addrconf: prefix with wrong length 56 Sep 16 15:55:53 r25543 syslogd 1.5.0#2ubuntu6: restart. |






