Analiza de frecvență

Calcularea caracteristicilor statistice

Pentru a obține statistici descriptive ale variabilelor numerice, puteți face clic pe caseta de dialog Frecvențe de pe butonul Statistici. (Statistică). Se afișează caseta de dialog Frecvențe: Statistici.







În grupul Valori percentilă, puteți alege una dintre următoarele opțiuni:

Quartiks (quartile): vor fi afișate primul, al doilea și al treilea trimestru. Prima quartila (Q,) este punctul de pe scara valorilor măsurate, sub care (la stânga) se află 25% din valorile măsurate. A doua quartilă (Q2) este punctul sub care sunt localizate 50% din valorile măsurate. A doua quartilă este numită și mediană. Cea de-a treia cartelă (Q3) este punctul de pe scala valorilor măsurate, sub care se află 75% din valori. Dacă datele sunt doar sub forma unei relații de ordine, atunci latitudinea interquartila este folosită ca măsură a răspândirii. Acesta este definit ca

Fig. Caseta de dialog Frecvențe: Statistici

Puncte de tăiere: Se vor calcula valorile percentilei care împart proba în grupe de observare care au aceeași lățime, care include același număr de valori măsurate. Numărul implicit de grupuri set 10. Dacă, de exemplu, 4, sunt prezentate cuartile adică quartilele corespund percentile 25, 50 și 75. Se poate observa că numărul de percentile afișat este unul mai puțin decât un număr predeterminat de grupuri.

Percentilă (e): Aceasta se referă la valorile percentilei definite de utilizator. Introduceți o valoare percentilă între 0 și 100 și faceți clic pe butonul Adăugați. Repetați acești pași pentru toate valorile percentilei dorite. Valorile în ordine crescătoare vor fi afișate în listă. De exemplu, dacă introduceți 25, 50 și 75, primim quartile. Puteți specifica orice valoare percentilei, de exemplu, 37 și 83. În primul caz (37) este prezentată o valoare variabilă selectată sub care se situează 37% din valorile, iar în al doilea caz (83) - valoarea sub care 83% din valorile.

În grupul Dispersiune, puteți selecta următoarele măsuri de împrăștiere:

Std. deviație: deviația standard este o măsură a răspândirii valorilor măsurate; este egal cu rădăcina pătrată a variației. În intervalul de lățime egal cu dublul abaterii standard, care este așezat pe ambele părți ale valorii medii, se situează aproximativ 67% din toate valorile eșantionului care respectă distribuția normală.

Varianță: Dispersia este pătratul deviației standard și, prin urmare, această caracteristică este de asemenea o măsură a răspândirii cantităților măsurate. Acesta este definit ca suma abaterilor pătrat ale tuturor valorilor măsurate din media lor aritmetică, împărțită la numărul de măsurători minus 1.

Interval: Levierul reprezintă diferența dintre cea mai mare valoare (maximă) și cea mai mică valoare (minimă).

Minim: cea mai mică valoare.

Maxim: Valoarea cea mai mare.

S.E. înseamnă: Aceasta este eroarea standard a mediei. În intervalul de lățime egal cu dublul erorii standard, reprezentat în jurul valorii medii, populația medie este localizată cu o probabilitate de aproximativ 67%. Eroarea standard este definită ca abaterea standard împărțită la rădăcina pătrată a mărimii eșantionului.

În mod obișnuit, abaterea standard și eroarea standard sunt măsurători de variație a variabilelor legate de scala intervalului și supuse unei distribuții normale. După cum sa menționat mai sus, abaterea standard vă permite să specificați intervalul de variație a valorilor individuale. Conform așa-numitei fuzetă regulă, într-un interval de deviația standard (acoperind lățimea deviației standard în ambele sensuri de la valoarea medie) este de aproximativ 67% din valorile indicate în intervalul de două ori deviația standard - aproximativ 95%, iar în intervalul de trei ori abaterea standard - aproximativ 99% din valorile .







Pe de altă parte, eroarea standard vă permite să setați un interval de încredere pentru media. În intervalul de două ori eroarea standard, pe ambele părți ale valorii medii cu o probabilitate de aproximativ 95% este media populației. Cu o probabilitate de aproximativ 99%, aceasta se situează în intervalul de trei ori eroarea standard. Adesea, numai una dintre aceste două măsuri de răspândire este indicată, de obicei o eroare standard, deoarece valoarea sa este mai mică. În toate cazurile, este necesar să se determine exact care este măsura dispersiei.

În grupul Central Tendency, puteți selecta următoarele caracteristici:

Media: Media reprezintă media aritmetică a valorilor măsurate; este definit ca suma valorilor împărțite la numărul lor. De exemplu, dacă există 12 valori măsurate și suma lor este 600, atunci valoarea medie va fi x = 600. 12 = 50.

Median: Mediana este punctul de pe scara valorilor măsurate, deasupra și sub care este jumătate din valorile măsurate. De exemplu, dacă valorile măsurate sunt:

apoi mai întâi sunt aranjate în ordine crescătoare: 23344567889.

În acest caz, valoarea mediană este 5. În total, avem 11 valori măsurate, deci mediana este a șasea valoare. Deasupra acesteia sunt 5 valori, iar mai jos - 5. Cu un număr impar de valori, media va coincide întotdeauna cu una dintre valorile măsurate. Pentru un număr par, mediana va fi media aritmetică a celor două valori vecine. De exemplu, dacă sunt disponibile următoarele valori măsurate:

atunci mediana în acest caz va fi egală cu: (6 + 7). 2 = 6,5.

Mod: Moda este valoarea cea mai frecventă în eșantion. Dacă frecvența cea mai mare apare pentru mai multe valori, atunci este ales cel mai mic dintre acestea.

Sumă: Suma tuturor valorilor.

În grupul Distribuție, puteți alege următoarele măsuri de asimetrie distributivă:

Skewness (coeficient de asimetrie): factor de asimetrie - o măsură a distribuției de frecvență a abaterilor de la această distribuție simetrică, adică una care se află la aceeași distanță față de medie pe ambele părți ale eșantionului de date este același număr de valori. Dacă observațiile respectă o distribuție normală, atunci asimetria este zero. Pentru a verifica distribuția normală, puteți utiliza următoarea regulă: În cazul în care asimetria este semnificativ diferită de zero, ipoteza că datele provin dintr-o populație generală normală, ar trebui să fie respins. Dacă vârful distribuției asimetrice este deplasat la valori mai mici, atunci există o asimetrie pozitivă, în caz contrar, o asimetrie negativă.

Kurtosis (Coeficient de variație sau kurtoză): Coeficientul de variație indică dacă distribuția este plată (pentru o valoare mare a coeficientului) sau abrupte. Coeficientul de variație este zero dacă observațiile respectă o distribuție normală. Prin urmare, pentru a verifica o distribuție normală, se poate aplica încă o regulă: Dacă coeficientul de variație este semnificativ diferit de zero, atunci ipoteza că datele sunt preluate dintr-o populație distribuită în mod normal trebuie respinsă.

De regulă, pentru variabilele aparținând scării intervalului și supuse distribuției normale, media este utilizată ca principală caracteristică și ca măsură a dispersiei, deviației standard sau erorii standard. Pentru variabilele ordinale sau de interval care nu se supun distribuției normale, respectiv mediei sau primului și celui de-al treilea trimestru. Pentru variabilele legate de scala nominală, este imposibil să se dea alte caracteristici semnificative, altele decât moda.

În caseta de dialog există mai multă casetă de selectare:

Valorile sunt mediane de grup (valori sunt grupuri medii dots): Când este selectată, apoi în calcularea medianei și valorile rămase de evaluare Perc-Tiley acestor caracteristici vor fi determinate pentru datele concentrate. O secțiune separată este dedicată acestei întrebări.

Pentru a modifica variabila (varsta) vom determina următoarele caracteristici: media, mediana, modul, cuartilele, deviație standard, varianța, interval, minim, maxim, eroare standard, skewness și kurtosis. Faceți următoarele:

Selectați comanda Analiză Frecvențe statistice descriptive. (Frecvențe)

În caseta de dialog Frecvențe, faceți clic pe butonul Reset pentru a anula setările anterioare.

Trageți variabila alter la lista de variabile de ieșire.

Faceți clic pe butonul Statistici. (Statistică).

În caseta de dialog Frecvențe: statistici, bifați casetele de selectare pentru caracteristicile dorite. Apoi faceți clic pe butonul Continuare. Veți reveni la dialogul Frecvențe.

În caseta de dialog Frecvențe, dezactivați opțiunea de afișare a meselor de afișare. Faceți clic pe OK.







Articole similare

Trimiteți-le prietenilor: