Cum se identifică o problemă hardware cu serverul

În acest articol, vom examina diagnosticarea și diagnosticarea driverelor necorespunzătoare, capacitatea de a testa RAM și, de asemenea, luăm în considerare trimiterea unei cereri la suportul tehnic.







Analiza cererilor de sprijin legate de problemele de hardware pe servere dedicate, pot fi rezumate după cum urmează: majoritatea clienților pur și simplu nu știu cum să identifice în mod corect problema care a apărut pe server, și, de asemenea, să facă o cerere clară pentru specialiștii companiei.

Ajutați clienții în această chestiune și vor fi scopul acestui articol. În multe aplicații, clientul nu indică toate informațiile necesare despre server, a căror elucidare întârzie rezolvarea problemelor.

Serverul, fiind un dispozitiv electronic, ar putea eșua mai devreme sau mai târziu. Orice dispozitiv electronic modern, și în special serverul, este construit pe principiul modular, care are multe avantaje: interschimbabilitatea, înlocuirea rapidă și diagnosticarea fără utilizarea echipamentelor speciale. Când serverul nu mai funcționează, aceste avantaje joacă un rol imens.

Cea mai tipică situație este atunci când serverul nu mai răspunde. Înainte de a scrie o solicitare la asistența tehnică, trebuie efectuate următoarele măsuri de diagnosticare:

Mai întâi, trebuie să reporniți serverul utilizând panoul de control DCImanager, "Reporniți".

Dacă serverul nu pornește, după un timp, ar trebui să solicitați un IP-KVM pentru a accesa consola server și a vedea ieșirea erorilor.

Poate că există o verificare a sistemului de fișiere, în cel mai rău scenariu - pe consola erorii "kernel panic", erori "eroare de boot disc, inserați discul de sistem și apăsați enter", un ecran întunecat. În primul caz, trebuie doar să așteptați, serverul va "crește". În al doilea caz, este recomandabil să contactați specialiștii tehnici ai companiei.

După pornirea serverului, este necesar să verificați starea unităților de hard disk.

Pentru a instala pachetul, utilizați comanda pentru distribuția sistemului de operare:


Verificăm discul astfel:

Numele discului poate fi diferit și poate fi unul dintre următoarele:

Serverul virtual pe virtualizarea KVM are discuri / dev / vda

De exemplu, pentru FreeBSD, comanda ar putea arăta astfel:

și pentru Linux, cum ar fi:

O descriere detaliată poate fi găsită pe site-ul oficial al proiectului smartmontools. descrierea atributelor în limba rusă pe Wikipedia.

După ce ați primit date SMART de pe disc, trebuie să fiți atenți la următorii indicatori:

Numărul de sectoare reallocat - indică numărul de sectoare remapate (remaparea). Un număr mare indică probleme cu suprafața discurilor. Acesta poate fi considerat un parametru cheie atunci când se evaluează starea unui disc, mai ales cu o creștere constantă a acestui parametru.







Sector Count Countable - Numărul de erori necorectate. Atributul arată numărul total de erori care au apărut la citirea / scrierea sectorului și care nu au putut fi corectate. O creștere a valorii câmpului valorii brute a acestui atribut indică defecte de suprafață evidente și / sau probleme în mecanica unității.

Luarea în considerare a parametrilor rămași este mai puțin importantă și depășește domeniul de aplicare al acestui articol. O descriere mai detaliată se referă la resursa specificată mai sus.

În acest caz, există o mare valoare „realocat Count sectoare“, care indică posibila prezență a sectoarelor defecte (blocuri de rău) și „Seek_Error_Rate“ - eroare de poziție citește unitatea cap. În acest exemplu, discul poate fi considerat un eșec în viitorul apropiat, este posibil eșec.

Experiența noastră arată că, în cazul în care Contorizarea sectorul nerectificabile valoare, Contele curent în așteptare Sector, UDMA_CRC_Error_Count mai mare decât zero, atunci hard disk-ul are nevoie urgentă de înlocuire.

De asemenea, va fi util să testați discul:

Urmați procesul și vedeți rezultatul cu comanda:

Indicatorul principal al sănătății discului:


Indicator avertizare medie - această variabilă indică în mod direct uzura discului. Contorul are o valoare nenulă la început (100), și scade cu timpul. Când se atinge un anumit prag determinat de producător, discul este recunoscut ca uzat și intră într-un mod numai pentru citire.

Dacă valoarea sa a scăzut sub 10, atunci este timpul să schimbați discul.

De asemenea, merită acordată atenție:

După primirea și analizarea indicatorilor SMART, trebuie să scrieți o solicitare asistenței tehnice. O interogare bine formată facilitează activitatea specialiștilor și reduce timpul de reacție.

Informații necesare pentru trimiterea unei solicitări:

  • Datele de identificare ale discului eșuat, dacă este imposibil de extras, datele de pe întregul disc. Informațiile vor fi transferate personalului tehnic din DC, care va fi angajat să înlocuiască discul eșuat.
  • Rezultatul executării comenzii smartctl -a pe hard disk-ul cu probleme.
  • Accesul la date pentru server, pentru a confirma starea discurilor de către angajații companiei.

Mesajele care nu conțin aceste informații nu pot fi acceptate pentru examinare.

Lucrarea utilității smartctl. Pentru a determina datele despre un disc eșuat, este necesar următorul bloc de informații:

Exemplu de interogare

Să luăm în considerare un mic exemplu de corespondență a unui client imaginar K cu un angajat de suport tehnic C:

Acest dialog poate fi redus la o cerere de înlocuire a discului și a răspunsului la lucrare:

O astfel de solicitare va fi executată de către personalul de asistență tehnică fără alte întrebări clarificatoare, ceea ce reduce durata de execuție a aplicației și salvează orele de lucru ale personalului de asistență tehnică.

După detectarea problemei cu memoria, scrieți o solicitare asistenței tehnice. În cerere, trebuie să atașați o captură de ecran cu o eroare. Mesajele care nu conțin aceste informații nu pot fi acceptate pentru examinare. Dacă furnizorul dvs. nu oferă acces la panoul DCImanager, trebuie să scrieți imediat o scrisoare de asistență cu solicitarea de a efectua acest test. Dacă confirmați eroarea, memoria va fi înlocuită.

În loc de concluzie, aș dori să spun următoarele: problema de a scoate hard-urile din ordine este un fenomen previzibil, iar serviciul de monitorizare a stării discului smartdont, inclus și în pachetul smartmontools, poate ajuta în acest sens. Reglarea și utilizarea acestuia au fost considerate în mod repetat pe Internet și depășesc domeniul de aplicare al acestui articol. Utilizarea acestui instrument de monitorizare de către clienți vă poate salva de pierderea nedorită a datelor.

Problemele RAM sunt imprevizibile și spontane. Eșecul său nu amenință pierderea de informații, ci cauzează o perioadă de nefuncționare în funcționare.

Și ultimul lucru - vă dorim ca serverele dvs. să nu se descompună și că au existat mai puține cereri de asistență tehnică pe această temă.







Articole similare

Trimiteți-le prietenilor: