Principii de construire a grupărilor și clasificărilor statistice

Clasificarea este distribuția sistematică a fenomenelor în anumite grupuri, clase, categorii bazate pe asemănările și diferențele dintre ele.
Să enumerăm caracteristicile distinctive ale clasificării:






1) se bazează pe un atribut calitativ;
2) Clasificările sunt standard. Acestea sunt stabilite de organele de stat și statisticile internaționale;
3) clasificările sunt stabile (adică rămân neschimbate pentru o perioadă lungă de timp).
Dacă gruparea este efectuată pe o bază cantitativă, atunci este necesar să se acorde o atenție specială numărului de unități ale obiectului studiat și gradului de variabilitate a atributului de grupare.
Atunci când se utilizează computere personale pentru prelucrarea datelor statistice, gruparea unităților obiectului se efectuează prin proceduri standard.
O astfel de procedură se bazează pe folosirea formulei Sturgess pentru a determina numărul optim de grupuri:

unde n este numărul de grupe, N este numărul de unități ale populației.
Conform formulei (2.1), alegerea numărului de grupuri depinde de volumul populației.
Dezavantajul formulării este că aplicarea sa dă rezultate bune dacă agregatul constă dintr-un număr mare de unități, iar distribuția unităților de la baza grupării este aproape de normă.
O altă modalitate de determinare a numărului de grupuri se bazează pe utilizarea abaterii standard. Dacă valoarea intervalului de grupuri este de 0,5 s, atunci populația este împărțită în 12 grupe, iar atunci când valoarea este de 2/3 s și s, atunci populația este împărțită în 9 și, respectiv, 6 grupuri. Dacă populația este împărțită în 12 grupe, intervalele sunt construite după cum urmează:

de la - 3,0 s până la -2,5 s

de la - 2,5 s până la - 2,0 s

de la -2,0 s la - 1,5 s

de la - 1,5 s până la - 1,0 s

de la -1,0 s la -0,5 s

de la + 0,5 s până la + 1,0 s

de la + 1,0 s până la + 1,5 s

de la + 1,5 s până la + 2,0 s

de la + 2,0 s până la + 2,5 s

de la + 2,5 s până la + 3,0 s,


unde este valoarea medie a atributului pe populație, care este determinată de formula. unde - este valoarea caracteristicii, s este deviația standard.
Aceste metode pot forma grupuri "goale" sau mici, în care nu a intrat o singură unitate a setului. Prezența unor astfel de intervale indică incorectitatea construcției grupării.






După determinarea numărului de grupuri, de exemplu, utilizând formula Sturgess, trebuie să definiți intervalul de grupare.

Intervalul sunt valorile unei caracteristici variabile care se află în anumite limite. Fiecare interval are o valoare proprie, limitele superioară și inferioară, sau cel puțin una dintre ele. Limita inferioară a intervalului este cea mai mică valoare a caracteristicii din interval, iar limita superioară este cea mai mare valoare a caracteristicii din interval. Valoarea intervalului (sau a diferenței de interval) este diferența dintre limitele superioare și inferioare ale intervalului. Intervalele de grupare sunt egale și inegale. Acestea din urmă sunt împărțite în creștere progresivă, în scădere progresivă, arbitrare și specializată. Dacă valoarea semnului se manifestă în limite relativ înguste și distribuția este uniformă, atunci o grupare se face la intervale egale. Valoarea unui interval egal este determinată de formula:

unde - intervalul de variație, Xmax, Xmin - valorile maxime și minime ale caracteristicilor din agregat și n - numărul de grupuri.
Înainte de a determina intervalul de variație, este necesar să excludem observațiile anormale din partea populației.
Valoarea obținută prin formula (2.2) este rotunjită. Este pasul intervalului.
Există următoarele reguli pentru determinarea intervalului de pași. Dacă valoarea intervalului calculată prin formula (2.2) este o cantitate având un semn până la punctul zecimal (de exemplu, 0.66, 1.372, 5.8), atunci este recomandabil să rotunjiți valorile obținute la zeci și să le folosiți ca interval de trepte. În exemplul de mai sus, distanța dintre intervale va fi, respectiv, 0,7; 1.4; 5.8.
Când valoarea intervalului calculat are două cifre semnificative la punctul zecimal și la mai multe zecimale, această valoare trebuie rotunjită la cel mai apropiat număr întreg. De exemplu: 12,785; 15.01; 13; 15.
În cazul în care valoarea intervalului calculat este un număr din trei cifre, patru cifre și așa mai departe, această valoare trebuie rotunjită la cel mai apropiat număr de 100 sau 50. De exemplu, 248 ar trebui rotunjită la 250.
Să luăm în considerare un exemplu. Este necesar să se grupeze la aceleași intervale ale întreprinderilor cu valoarea activelor fixe, în timp ce valoarea maximă a semnului Xmax = 2040 milioane ruble. iar valoarea minimă este Xmin = 290 milioane ruble. Agregatul include 80 de unități. Conform formulei (2.1), aceasta trebuie împărțită în 7 grupe. Mai întâi trebuie să găsești

R = 2040-290 = 1750 de milioane de ruble.
Definiți valoarea intervalului: milioane de ruble.
După aceasta, construim intervalele grupurilor (Tabelul 2.5).

Tabelul 2.5.
Opțiuni pentru grupuri de clădiri

Valoarea fiecărui interval ulterior pentru această grupare este mai mare decât intervalul anterior cu 200 de milioane de ruble. adică, crește într-o progresie aritmetică.

Regulile de introducere a datelor

Adresați-vă întrebările sau lăsați-vă dorințele sau comentariile în partea de jos a paginii în secțiunea Disqus.
De asemenea, puteți lăsa o solicitare de ajutor în rezolvarea activității de control cu ​​partenerii noștri de încredere (aici sau aici).







Articole similare

Trimiteți-le prietenilor: