Minor Gres, Major Catastrophe - GitLab merge offline pentru o zi
GitLab, un startup care este o alternativă la GitHub foarte popular, a avut o zi destul de dură ca recent eroarea umană a determinat ca întregul site web să fie dezactivat pentru o zi întreagă.
Problema lui GitLab a început atunci când site-ul web a avut probleme de încărcare și de stabilitate. Site-ul a fost trimis offline pentru a remedia problemele. Cu toate acestea, în timpul întreținerii, cineva a făcut fără greseală greșeala de a șterge accidental un director care conține 300 GB de date de producție live.
Din fericire pentru GitLab, conținutul care a fost șters doar problemele afectate și cererile fuzionate. Depozitele și wiki-urile nu au fost afectate în niciun fel de această greșeală, ceea ce înseamnă că daunele cauzate de această greșeală nu au fost atât de grave așa cum ar fi putut fi
Cu directorul șters, personalul GitLab se întoarce imediat spre backup. Din păcate, pentru ei, GitLab a intrat încă o altă problemă. În conformitate cu fișierul Google Doc care a fost actualizat în mod constant deoarece GitLab se străduiește să se întoarcă online, toate cele 5 copii de rezervă / replicare tehnicile pe care site-ul implementat nu au reușit să funcționeze în mod fiabil, și în unele cazuri au fost niciodată nu sa înființat în primul rând.
Preluarea acestor fișiere pierdute din cloud nu este o opțiune pentru GitLab fie ca startup a decis la sfârșitul anului trecut la aruncați norul pentru a-și construi și opera propriile clustere Ceph în schimb. Inutil să spun că GitLab își reconsideră acum poziția pe acest subiect.
@TheRegister @gitlab va lucra la punerea în aplicare mai performantă a aplicației și la explorarea furnizorilor alternativi de cloud hosting.
- Connor Shea (@connorjshea) 1 februarie 2017
În ciuda zilei tumultuoase pe care a avut-o GitLab, site-ul web este în desfășurare și funcționează normal. În timp ce site-ul web a raportat că unele date au fost pierdute în timpul unei ferestre de șase ore, Git arhivele au rămas nevătămate în întreaga încercare. Un jurnal incident complet al întregului eveniment poate fi vizualizat aici.
În timp ce mulți lecțiile pot fi învățate din greșeala mică a lui GitLab (în principal hubris), metoda GitLab de a face față crizei este destul de admirabilă lansarea a fost clară și transparentă cu utilizatorii săi. Iată că sperăm că GitLab învață din această greșeală. În caz contrar, baza de utilizatori ar fi, probabil, mai puțin iertată dacă istoria se repetă.
Sursa: Registrul