Ce sa întâmplat cu Smith,

3:26 S-au trezit devreme, astăzi este o zi responsabilă, trebuie să elimini serverul de la centrul de date pentru prevenirea completă.

3:32 am verificat cum se face transferul principalelor resurse. Toate în funcție de plan. Specialiștii nu au dormit toată noaptea, dar noaptea este singura dată când nu există un volum mare de muncă pe server și totul poate fi transferat destul de nedureros.







Verificarea verificării. Datele s-au acumulat foarte mult, pe lângă serverul original, hard disk-urile au fost blocate. Transferul este întârziat.

6:37 Transferul este complet. Rămâne să verificăm integritatea datelor și să "stingem" serverul.

7:42 Aziz a sunat înapoi. Datele sunt transferate corect, putem merge pentru a ridica serverul. Vocea lui e obosită, se simte noaptea muncii grele. A fost necesar să se facă niște proceduri birocratice în biroul centrelor de date. Ei au o zi lucrătoare de la ora 10 dimineața, documentele vor fi pregătite nu mai devreme de 11. L-am trimis pe Aziz la culcare înainte de 12 ani. A luat ganterele.

8:42 Apelul de la Aziz. 1/3 din Kaznet este oprit, clienții, prietenii, partenerii toți vor să știe de ce site-urile lor web și serviciile SaaSS nu funcționează. Deconectat Chokolife înseamnă nu numai în datacenterul nostru, ci și în întreaga clădire Transtelecom. Aziz cere să știe adevăratul motiv. Pe internet, zvonuri despre un atac terorist și alte prostii. Promit să vă sun, cum să aflați.

Ce sa întâmplat cu Smith,

Nu zic nicăieri. Știu din experiență că acum întreaga echipă de Internet a companiei PS are un baraj de apeluri, răspunsul este probabil să fie standard, iar imaginea reală a ceea ce se va întâmpla nu va. Știu, de asemenea, că toți specialiștii tehnici condus de director sunt ridicați la alarmă și acum fac totul pentru a porni serverele cât mai curând posibil, pentru a le numi este să distrageți de la locul de muncă și să creați nervozitate suplimentară. Mă întorc la gantere.

9:47 Îl sun pe Keith (directorul Nikita Krasulin al furnizorului de hosting). De asemenea, vorbim despre acest caz. Cauza accidentului este eliminată, consecințele vor fi corectate într-o oră de maximum două. Vocea este calmă și încrezătoare, apoi totul este sub control.







11:10 Site-uri câștigate.

11:15 Sa lansat sistemul de securitate a informațiilor SAFI.

11:22 Sistemul de parcare a fost complet restaurat.

11:35 Testarea completa a tuturor serviciilor noastre. Totul este în ordine, nu există eșecuri, integritatea datelor nu este ruptă. În paralel, monitorul "vecinii" - kolesa.kz este încă "mincinos".

12:20 În biroul centrului de date. Surprinzător de liniștită și calmă. Aflăm că acum o oră era aici un adevărat iad. Toate apelurile din centrul de date, unde se află asistența tehnică, au fost transferate la biroul de vânzări. Toți managerii ridicați de alarmă se aflau pe gard aproximativ jumătate de oră după accident și au preluat principalul "atac" al clienților. Astfel, "tehnicienii" au fost eliberați din apeluri și s-ar putea concentra asupra depanării.

12:51 Centrul de date. De obicei e gol, dar de data asta erau câțiva oameni. Toți au acționat fără agitație, dar destul de repede. Noi, de asemenea, nu am fumble. Server "stins" de pe mobil, urcând pe scări. Au scos-o din bar și s-au îndreptat către ieșire.

Ce sa întâmplat cu Smith,

13:07 La ieșirea din clădire a apărut o problemă, securitatea a verificat cu atenție documentele. Apoi sa dovedit totul. Potrivit martorului ocular, s-au întâmplat următoarele:

La ora 8:10, tensiunea din întregul sistem de alimentare cu energie a centrului de date a dispărut. În același timp, tensiunea din sursa centrală de alimentare rămâne. Deci, sa dovedit că a existat lumină în toată clădirea și nu există un centru de date, care în sine este un nonsens, pentru că ar trebui să fie invers.

Alimentarea cu energie a centrului de date este construită astfel încât, în orice situație, electricitatea trebuie să curgă în ea. În cazul unei întreruperi a energiei în centrul de date, se pornește un generator electric diesel și sursa de alimentare a serverului este furnizată în mod autonom din întreaga clădire.

Cauza accidentului a fost sistemul în sine pentru a proteja împotriva eșecului de putere. Sursa de alimentare neîntreruptibilă asigură continuitatea alimentării cu energie electrică în momentul trecerii de la sursa centrală de alimentare la sursa autonomă. El a fost cel care sa desființat.

Ce sa întâmplat cu Smith,

1/3 Kaznet a dispărut într-o clipă datorită UPSa obișnuită.

Timp de o oră, UPS reparat, eliminarea consecințelor a durat încă 2 ore.

În momentul în care am părăsit clădirea centrului de date, Kaznet trăise deja o viață normală.

14:36 ​​Am început munca preventivă pe server. Unitățile hard disk sunt înlocuite. Motivul deteriorării rapide este absența unui cache în controler.

15:10 Am comandat un nou operator pe eBay.

3:47 Ascendent, astăzi este o zi responsabilă. A promis de prieteni să scrie un articol despre ceea ce sa întâmplat în Kaznet.

3:52 Am ales stilul jurnalului meu personal pentru a descrie evenimentele.







Articole similare

Trimiteți-le prietenilor: