Statistici descriptive pentru variabilele numerice

6.2. Încheierea caracteristicilor statistice

Pentru a obține statistici descriptive ale variabilelor numerice, puteți face clic pe caseta de dialog Frecvențe de pe butonul Statistici. (Statistică). Se afișează caseta de dialog Frecvențe: Statistici.

Fig. 6.2: Caseta de dialog Frecvențe: Statistici

În grupul Valori percentilă, puteți alege una dintre următoarele opțiuni:

Quartiles (Quartiles). Primul, al doilea și al treilea trimestru vor fi afișate. Prima cvartal (Q1) este punctul de pe scara valorilor măsurate, sub (în stânga) 25% din valorile măsurate. A doua quartilă (Q2) este punctul sub care sunt localizate 50% din valorile măsurate. A doua quartilă este numită și mediană. Cea de-a treia cartelă (Q3) este punctul de pe scala valorilor măsurate, sub care se află 75% din valori. În cazul în care datele sunt doar sub forma unei relații de ordin, atunci latitudinea inter-quartilă este folosită ca măsură a răspândirii. Acesta este definit ca
  • Punctele de tăiere. Se calculează valorile percentilei care separă proba în grupe de observare care au aceeași lățime, adică includ același număr de valori măsurate. Numărul implicit de grupuri set 10. Dacă, de exemplu, 4, sunt prezentate cuartile adică quartilele corespund percentile 25, 50 și 75. Se poate observa că numărul de percentile afișat este unul mai puțin decât un număr predeterminat de grupuri.
  • Percentilă (e). Aici înțelegem valorile percentilelor determinate de utilizator. Introduceți o valoare percentilă între 0 și 100 și faceți clic pe butonul Adăugați. Repetați acești pași pentru toate valorile percentilei dorite. Valorile în ordine crescătoare vor fi afișate în listă. De exemplu, dacă introduceți 25, 50 și 75, primim quartile. Puteți specifica orice valoare percentilei, de exemplu, 37 și 83. În primul caz (37) este prezentată o valoare variabilă selectată sub care se situează 37% din valorile, iar în al doilea caz (83) - valoarea sub care 83% din valorile.

În grupul Dispersiune, puteți selecta următoarele măsuri de împrăștiere:

Std. deviația (deviația standard) este o măsură a răspândirii valorilor măsurate; este egal cu rădăcina pătrată a variației. În intervalul de lățime egal cu dublul deviației standard, care se situează pe ambele părți ale mediei, se situează aproximativ 67% din toate valorile eșantionului care respectă distribuția normală.
  • Varianța este pătratul deviației standard și, prin urmare, această caracteristică este, de asemenea, o măsură a răspândirii cantităților măsurate. O este definită ca suma pătratelor de deviații ale tuturor valorilor măsurate din media lor aritmetică, împărțită la numărul de măsurători minus 1.
  • Intervalul este diferența dintre cea mai mare valoare (maximă) și cea mai mică valoare (minimă).
  • Minim - Valoarea cea mai mică.
  • Maximă - Valoarea cea mai mare.
  • S.E. mean - În intervalul de lățime egal cu dublul erorii standard, reprezentat în jurul valorii medii, valoarea medie a populației este localizată cu o probabilitate de aproximativ 67%. Eroarea standard este definită ca abaterea standard împărțită la rădăcina pătrată a mărimii eșantionului.

  • În mod obișnuit, abaterea standard și eroarea standard sunt măsurători de variație a variabilelor legate de scala intervalului și supuse unei distribuții normale. După cum sa menționat mai sus, abaterea standard vă permite să specificați intervalul de variație a valorilor individuale. Conform așa-numitei fuzetă regulă, într-un interval de deviația standard (acoperind lățimea deviației standard în ambele sensuri de la valoarea medie) este de aproximativ 67% din valorile indicate în intervalul de două ori deviația standard - aproximativ 95%, iar în intervalul de trei ori abaterea standard - aproximativ 99% din valorile .

    Pe de altă parte, eroarea standard vă permite să setați un interval de încredere pentru media. În intervalul de două ori eroarea standard, pe ambele părți ale valorii medii cu o probabilitate de aproximativ 95% este media populației. Cu o probabilitate de aproximativ 99%, aceasta se situează în intervalul de trei ori eroarea standard. Adesea, doar una dintre aceste două măsuri de răspândire este indicată, de obicei o eroare standard, deoarece valoarea sa este mai mică. În toate cazurile, este necesar să se determine exact care este măsura dispersiei.

    În grupul Central Tendency, puteți selecta următoarele caracteristici:

    Media reprezintă media aritmetică a valorilor măsurate; este definit ca suma valorilor împărțite la numărul lor. De exemplu, dacă există 12 valori măsurate și suma lor este 600, atunci valoarea medie va fi x = 600. 12 = 50.
  • Medianul este punctul de pe scara valorilor măsurate, deasupra și dedesubtul căruia se află jumătate din toate valorile măsurate. De exemplu, dacă valorile măsurate sunt:

  • mai întâi acestea sunt aranjate în ordine crescătoare: 233445 67889.

    În acest caz, valoarea mediană este 5. În total, avem 11 valori măsurate, deci mediana este a șasea valoare. Deasupra acesteia sunt 5 valori, iar mai jos - 5. Cu un număr impar de valori, media va coincide întotdeauna cu una dintre valorile măsurate. Pentru un număr par, mediana va fi media aritmetică a celor două valori vecine. De exemplu, dacă sunt disponibile următoarele valori măsurate:

    atunci mediana în acest caz va fi egală cu: (6 + 7). 2 = 6,5.

    Modul este valoarea cea mai des întâlnită în eșantion. Dacă frecvența cea mai mare apare pentru mai multe valori, atunci este aleasă cea mai mică dintre acestea.
  • Suma (suma) este suma tuturor valorilor.

  • În grupul Distribuție, puteți alege următoarele măsuri de asimetrie distributivă:

    Skewness (factor de asimetrie) - o măsură a distribuției de frecvență a abaterilor de la această distribuție simetrică, adică acelea care au la aceeași distanță față de valoarea medie a datelor de pe ambele părți ale eșantionului este același număr de valori. Dacă observațiile respectă o distribuție normală, atunci asimetria este zero. Pentru a verifica distribuția normală, puteți utiliza următoarea regulă: În cazul în care asimetria este semnificativ diferită de zero, ipoteza că datele provin dintr-o populație generală normală, ar trebui să fie respins. Dacă vârful distribuției asimetrice este deplasat la valori mai mici, atunci există o asimetrie pozitivă, în caz contrar, o asimetrie negativă.
  • Kurtosis (Coeficient de variație sau kurtosis) - indică dacă distribuția este plat (pentru un coeficient mare) sau abrupte. Coeficientul de variație este zero dacă observațiile respectă o distribuție normală. Prin urmare, pentru a verifica o distribuție normală, se poate aplica încă o regulă: Dacă coeficientul de variație este semnificativ diferit de zero, atunci ipoteza că datele sunt preluate dintr-o populație distribuită în mod normal trebuie respinsă.

  • De regulă, pentru variabilele aparținând scării intervalului și supuse distribuției normale, valoarea medie este utilizată ca principală caracteristică. și ca măsură de dispersie - deviația standard sau eroarea standard. Pentru variabilele ordinale sau de interval care nu respectă o distribuție normală, respectiv, trimestrul mediu sau primul și al treilea. Pentru variabilele legate de scala nominală, este imposibil să se dea alte caracteristici semnificative, altele decât moda.

    În caseta de dialog există mai multă casetă de selectare:

    Valorile sunt puncte medii ale grupului (Valorile reprezintă punctele medii ale grupurilor). Dacă bifați această casetă, atunci când calculați valorile mediane și cele percentile rămase, estimările acestor caracteristici vor fi determinate pentru datele concentrate. O secțiune separată este dedicată acestei întrebări.

    Pentru variația variabilă (vârstă), definim următoarele caracteristici: valoare medie, mediană, mod, quartile, deviație standard, varianță, interval, minim, maxim, eroare standard, asimetrie și kurtoză. Faceți următoarele:

    Selectați Analiză / Statistici descriptive / Frecvențe din meniu. (Frecvențe)
  • În caseta de dialog Frecvențe, faceți clic pe butonul Reset pentru a anula setările anterioare.
  • Trageți variabila alter la lista de variabile de ieșire.
  • Faceți clic pe butonul Statistici. (Statistică).
  • În caseta de dialog Frecvențe: statistici, bifați casetele de selectare pentru caracteristicile dorite. Apoi faceți clic pe butonul Continuare. Veți reveni la dialogul Frecvențe.
  • În caseta de dialog Frecvențe, dezactivați opțiunea de afișare a meselor de afișare. Faceți clic pe OK.







  • Trimiteți-le prietenilor: