Per circa un giorno (qualcosina in più, in realtà), fuorigio.co è rimasto down a causa di OVH e dei problemi relativi agli storage che ospitano i database MySQL. No SLA, “no-excuses”, niente di niente. Una telefonata al supporto, un paio di pagine dedicate allo stato di “salute dei servizi” e a ciò che stanno facendo per riportare online (ancora adesso) un numero non meglio definito di siti web. Gli operatori non sanno più che raccontare, quasi sono stufi di stare a sentire l’ennesima lamentela di persona pagante che non può sfruttare il servizio, e non certo per “una manciata di minuti“.
Agevolo URL che passano da Google Translate per trasformare il francese in inglese (ma perché usare il francese per qualcosa che impatta mezzo mondo? Credo che l’inglese in questi casi sia un atto dovuto, nda):
- FS#25697 — MySQL / Opérations du manager. L’incident è stato aperto dal primo minuto post-down, più o meno:
translate.googleusercontent.com/translate_c?act=url&depth=1&hl=en&ie=UTF8&prev=_t&rurl=translate.google.com&sl=auto&sp=nmt4&tl=en&u=http://travaux.ovh.net/%3Fdo%3Ddetails%26id%3D25697&usg=ALkJrhhI6Zv3pHJPLbiYBIW1egauIrQ2rQ - questo invece è ciò che spiega cos’è successo, un po’ più romanzato, per cercare di giustificare un restore con conseguente up & running che sta impiegando più di 24 ore, e che ancora non permette ad alcuni di accedere ai propri dati MySQL come si deve (senza considerare che un giorno di lavoro è andato completamente perduto, i backup girano durante la notte, anche quelli da me programmati oltre ciò che viene fatto girare dal provider):
translate.google.com/translate?sl=auto&tl=en&js=y&prev=_t&hl=en&ie=UTF-8&u=http%3A%2F%2Ftravaux.ovh.net%2F%3Fdo%3Ddetails%26id%3D25709&edit-text=&act=url
113 VM with the databases were impacted.
We are sincerely sorry for this failure. The
The last breakdown of this magnitude dates from 2006 and
At the time, we questioned all the
Storage technologies that we use at Ovh.
This breakdown is one more lesson and we will
To communicate the changes that will take place
End of this incident to avoid relive the next
Breakdown of this magnitude in 10 years.
Che un danno simile non si verificasse dal 2006 è lodevole (anche se lo considero più che normale, quando si svolge questo tipo di lavoro e si ha a che fare con così tanti clienti), che tutte le buone intenzioni (“per evitare ulteriori disastri per almeno altri 10 anni”) ci siano lo è altrettanto, ma che un sito web non torni up&running in tempi più decenti proprio no. Il nostro è un progetto che gestiamo nel tempo libero, che portiamo avanti per pura passione, che non ci paga gli stipendi. Se fosse stato qualcosa di diverso, qualcosa che non necessitava delle risorse messe a disposizione da un server dedicato (VPS e famiglia) o un investimento più grande (necessario per salire lo scalino da hosting condiviso a dedicato), quanto sarebbe stato carino e cortese dire “Niente SLA, sono cose che possono succedere e non ci sarà rimborso alcuno“?
A questo punto non resta che aspettare. Il nostro piccolo progetto collaterale è ora online ma con una caterva di errori WordPress randomici dovuti alla mancata possibilità di scrivere nel database attualmente tornato inizialmente disponibile in sola lettura, con tanto di informazioni in bella vista che non posso andare a togliere se non oscurando completamente il sito web. Cambierò nome, password e qualsiasi altra informazione a quel database, per evitare possibili ulteriori problemi in futuro.
L’amaro in bocca me lo rimetto nel sacco, il tempo perso invece no, quello è certamente passato a miglior vita, ora non resta che lavorare.
L'articolo potrebbe non essere aggiornato
Questo post è stato scritto più di 5 mesi fa, potrebbe non essere aggiornato. Per qualsiasi dubbio ti invito a lasciare un commento per chiedere ulteriori informazioni! :-)