Caracteristicile numerice ale eșantionului

Caracteristicile numerice ale eșantionului sunt parametrii eșantionului care exprimă caracteristicile cele mai semnificative ale distribuției statistice a eșantionului.

Mediul selectiv este valoarea medie aritmetică a atributului populației de eșantion.







Dacă distribuția statistică a eșantionului este dată de o serie de variație a intervalului, atunci în calcul este necesar să mergem la o serie variativă discretă, ale cărei variante sunt intervalele medii

Modul Mo este numit varianta, care are cea mai mare frecvență.

Pentru distribuția statistică interval, intervalul modal [xm; xm + 1), pentru care,

ni este numărul acestui interval.

Mediana unei distribuții statistice discrete este numită o variantă, care împarte seria de variație în două părți, egală cu numărul variantei.

Dacă numărul este ciudat, atunci,

Medianul Me al distribuției statistice intermediare este un număr pentru care egalitatea

Formula pentru calculul Me are forma

unde [xm; xm + 1) este intervalul parțial median pentru care inegalitatea

Dispersia eșantionului (dispersie selectivă) Dν este media pătratelor aritmetice ale deviațiilor valorilor observate ale caracteristicilor din valoarea lor medie.

Calculul DB poate fi simplificat folosind următoarea formulă

Dv caracterizează împrăștierea valorilor observate ale caracteristicilor cantitative în jurul valorii medii.

O abatere medie pătrată medie (standard) este rădăcina pătrată a lui Dv.

Mărimea variației lui R este diferența dintre cele mai mari și cele mai mici variante.

Intervalul de variație este cea mai simplă caracteristică a împrăștierii seriei variate.

Abaterea medie medie este media aritmetică a deviațiilor absolute

Valoarea medie absolută este utilizată pentru a caracteriza împrăștierea seriei variate.

Coeficientul de variație a V este procentul exprimat în procente de k.

Coeficientul de variație V servește la compararea valorilor de împrăștiere cu privire la două serii variate, chiar dacă variantele au dimensiuni diferite.

Caracteristicile statistice ale distribuțiilor statistice sunt momente statistice (empirice).

Momentul empiric obișnuit al ordinii lui l este valoarea medie a celui de-al treilea grad al diferențelor.

unde c este un număr constant arbitrar, așa-numitul. false zero.

Momentul empiric inițial al ordinului l este momentul obișnuit al ordinului l pentru c = 0.

adică, momentul empiric inițial al primei ordini este egal cu media eșantionului.

Momentul empiric central al ordinii lui l este momentul obișnuit al ordinii.

adică, momentul empiric central al ordinii a doua este egal cu variația eșantionului.

Momentele centrale pot fi exprimate prin obișnuirea:

Momentul empiric condiționat al ordinului l este momentul inițial al ordinului l. calculată pentru o versiune condiționată.

unde ui este o versiune condiționată.

Variantele definite de

unde c este orice varianta a lui xi. care este situat în mijlocul seriei de variații sau este o modă;

Astfel, pentru o serie variată constând dintr-o variantă echidistantă cu pasul h. variantele condiționale sunt numere întregi.

Exprimați momentele obișnuite prin condiționarea:

Înlocuind (5.22) în (5.18), putem obține formule convenabile pentru calcul, exprimând momente centrale prin intermediul celor condiționate.

Un exemplu. Pentru distribuția statistică, calculați caracteristicile numerice.

Teoria count definește metodele și metodele de estimare statistică a valorilor necunoscute ale parametrilor de distribuție aleatoare teoretice pentru un set de date experimentale. Se presupune adesea că legea de distribuție a populației este cunoscută, dar parametrii necunoscuți ai legii (speranța matematică, de dispersie) care trebuie să fie evaluate (aproximativ găsi) a eșantionului.

O estimare statistică a unui parametru necunoscut al unei distribuții teoretice este o funcție a valorilor eșantionului (varianta), care oferă o valoare aproximativă a parametrului estimat.

Toate estimările sunt împărțite în punct și interval.

Un punct este o estimare care este definită de un singur număr.

Următoarele cerințe sunt impuse estimărilor punctuale:

Să fie estimarea statistică a parametrului necunoscut al distribuției teoretice. Să presupunem că se găsește o estimare pentru un eșantion de volum n. Extrage din populația generală un alt eșantion de volum n și calculează. . Repetând experiența de mai multe ori, obținem numerele. , ...,. care, în general, sunt diferite unul de celălalt. Astfel, o estimare poate fi considerată ca o variabilă aleatoare și numere. , ..., - ca valori imbricate.







Imparțial este numită o estimare statistică. a cărui așteptare matematică este egală cu parametrul estimat pentru orice dimensiune a eșantionului, adică,

O compensare este o estimare a cărei așteptări matematice nu sunt egale cu parametrul estimat,

O estimare efectivă este o estimare statistică, care, pentru o mărimea probă n, are cea mai mică varianță posibilă.

O estimare statistică se numește o valoare de stat, care, având în vedere probabilitatea ca parametrul estimat,

unde este infinitezimea.

Calificarea mediu general mediu selectiv se efectuează în conformitate cu formula (5.4) și este nemeschonnoy consistentă și dacă prelevarea repetată și imparțială dacă proba noniterative.

Ca o estimare a varianței generale, este adoptată variația ajustată a eșantionului S 2.

care satisface cerința imparțialității. Evident, pentru valori suficient de mari de n, Db și S2 diferă puțin. În practică, S 2 este calculat dacă n <30.

Pentru a estima deviația standard a populației, se utilizează abaterea medie pătrată a eșantionului S sau deviația medie pătrată a eșantionului.

Toate estimările considerate (formulele (5.4), (5.11), (5.24), (5.25)) sunt estimări punctuale.

Estimările punctuale sunt utilizate în primul rând atunci când alte calcule sunt efectuate cu ajutorul lor. În acest caz, estimările punctuale nu conțin informații despre exactitatea unei anumite estimări. Pentru dimensiunile mici ale eșantioanelor, estimările punctuale pot să difere semnificativ de parametrul estimat.

O estimare este un interval, care este determinat de două numere - începutul și sfârșitul intervalului, în care parametrul estimat al distribuției teoretice se găsește cu o anumită probabilitate.

Să presupunem că estimarea statistică constatată din datele eșantionului este o estimare a parametrului necunoscut. Estimarea statistică determină cu mai multă precizie parametrul. Cu cât valoarea absolută a diferenței este mai mică. adică dacă u

apoi mai mici. cu cât evaluarea este mai exactă. Astfel, valoarea caracterizează precizia estimării.

De obicei, este stabilit în avans sub forma unui număr aproape de unitate, cel mai cinstit - 0,95; 0.99; 0.999.

Înlocuim inegalitatea din (5.27) printr-o inegalitate dublă echivalentă:

Intervalul este denumit confidențial. limitele sale - limite confidențiale.

Intervalul de încredere acoperă un parametru necunoscut cu fiabilitate.

Dacă variabila aleatoare X este distribuită în mod normal cu o așteptare matematică egală cu a și deviația standard este cunoscută și egală. apoi pentru o probă de volum n, puteți găsi limite de încredere pentru așteptarea matematică a ecuațiilor

unde a και a - limitele de încredere inferioare și superioare ale așteptărilor matematice a;

t este coeficientul determinat din tabelul funcției Laplace, la care corespunde valoarea funcției Laplace. În acest caz

O analiză cu formula (5.29) arată că

- Pe măsură ce volumul probei n crește, numărul scade și, prin urmare, crește precizia estimării;

- cu creșterea fiabilității, valorile creșterii t (funcția este în creștere) și. ceea ce duce la o scădere a exactității evaluării;

- dacă este necesar să se estimeze așteptările matematice cu precizia și fiabilitatea date în avans. atunci volumul minim al eșantionului care va asigura această precizie se găsește în formula

Formula (5.30) este utilizată pentru re-eșantionare, pentru o eșantionare, volumul minim este recalculat prin formula

unde N este populația generală.

Exemplul 1. O variabilă aleatoare X are o distribuție normală cu o abatere medie pătrată cunoscută. Găsiți intervalul de încredere pentru estimarea așteptărilor matematice necunoscute a prin. dacă și.

Am obținut intervalul de încredere necesar:

Exemplul 2. Găsiți volumul minim de probe repetate și ne-eșantionate pentru o populație cu un volum de N = 1000 s. la care precizia estimării așteptării matematice a unui atribut distribuit normal va fi de 0,2 pentru.

Acceptați mărimea noului eșantion n = 385.

Pentru un eșantion fără repetiție

Acceptăm volumul unei non-eșantionări.

Dacă variabila aleatoare X este în mod normal distribuită cu media egală cu o și deviația standard de necunoscut, volumul probei poate fi găsit n limitele de încredere pentru așteptarea unei formule

unde S este deviația standard corectată;

- raportul studentului, care este determinat de tabel, în funcție de fiabilitatea și numărul de grade de libertate, egal cu.

Cu o dimensiune nelimitată creștere a eșantionului n distribuție Student tinde la normal, cu toate acestea, atunci când n> 30 în (5.32) poate fi înlocuit.

Dacă variabila aleatoare X este distribuit în mod normal, iar deviația standard este necunoscută, atunci estima corectiv abaterea pomzhno S. standard, calculată pentru mărimea eșantionului n. prin formule

în cazul în care. - limitele inferioare și superioare de încredere ale deviației standard;

q este coeficientul de distribuție. determinată de tabel, în funcție de dimensiunea eșantionului n.

Dacă q<1. то учитывая, что . .

Un exemplu. Variabila aleatoare X are o distribuție normală. Din eșantionul de volum n = 10, a fost găsită deviația standard corectată S = 0,16. Găsiți un interval de încredere care acoperă o abatere standard necunoscută cu fiabilitate.

Din tabel, găsim q = 1,8 (q> 0) pentru și n = 10.

Limitele de încredere dorite ale intervalului de încredere:

Aplicarea practică a formulelor (5.28) și (5.32) a fost obținută pentru estimarea valorii reale a cantității măsurate, formula (5.33) - pentru estimarea preciziei măsurătorilor (precizia instrumentului).

Dacă variabila aleatoare X are o distribuție binomică, atunci este posibil să se estimeze probabilitatea necunoscută p de apariție a evenimentului A în fiecare test prin calcularea limitelor de încredere în conformitate cu formulele

unde pH și pB sunt limitele de încredere inferioare și superioare ale valorii de probabilitate necunoscută p;

w este frecvența relativă (estimarea punctului pentru p).

unde m este numărul de apariție al evenimentului A;

n este numărul de încercări.

Un exemplu. Studiile independente sunt efectuate cu aceeași probabilitate, dar necunoscută, de apariție a evenimentului A în fiecare studiu. Găsiți intervalul de încredere pentru estimarea p cu o fiabilitate de 0,95. dacă în 80 de procese evenimentul A a apărut de 16 ori.

Gasim t din tabelul functiei Laplace din relatie.

Înlocuirea cu n. w. t în formula (5.34), obținem

La valori mari de n (de ordinul sutelor), termenii sunt foarte mici și un factor. Prin urmare, limitele de încredere pot fi calculate din formule







Articole similare

Trimiteți-le prietenilor: