Criteriile Wilcoxon-Mann-Whitney

Acest criteriu are scopul de a testa omogenitatea celor două populații, înțeleasă în sensul că nu există diferențe în valorile parametrilor de localizare (medii, valori medii) ale distribuțiilor corespunzătoare.







Avem probe extrase din două populații generale (l = 2). Numărăm aceste eșantioane, astfel încât inegalitatea n1 n2 este satisfăcută. Combinând eșantioanele și construind un eșantion combinat de volum n1 + n2, construim o serie variată generală.

Statisticile critice ale criteriului descris au forma:

(2) și se numește suma rangurilor.

Următoarea regulă pentru testarea ipotezei:

1) Pentru un anumit nivel de semnificație folosind un criteriu tabele cuantile (puncte procentuale) a unei cuantila de distribuție standard normală definesc nivelul 1-a / 2 (sau un punct al distribuției normale standard 100a / 2%.

2) Calculăm valoarea standardizată a statisticilor critice g

unde valoarea g se calculează prin formula.

3) Dacă se dovedește asta

| gst |> U1-a / 2 sau | ga / 2 |> U1-a / 2. atunci ipoteza de testare trebuie respinsă (și, în consecință, pentru toate celelalte valori ale statisticilor critice standardizate.

Sub validitatea ipotezei testate, statisticile se comportă ca o variabilă distribuită în mod normal cu parametri:

Mai mult decât atât, convergența spre distribuția normală este foarte rapidă: funcționează deja eficient pentru n1> 8.

Se cântăresc datele de probă x1, ..., xn.

În general, greutatea wi ³ este atribuită observării xi, care este definită ca o funcție a valorii sale curente. De obicei, respectați condiția de normalizare 1

Prin w se înțelege vectorul de greutăți (w (x1) ... w (xn)) în expresia momentelor de eșantionare și funcția cu valorile w (x) în expresia pentru momentele teoretice.

Dacă se face cu rezultatele observațiilor de unidimensional x1 variabila aleatoare ... xn. este de multe ori greutatea xi observație este determinată în funcție de numărul de secvență în ordonată (crescător) un număr de observații, adică o variație a numărului de observații x1, x2, ..., xn și fiecare membru al unei xi serii ordonate i se atribuie o wi greutate.

Această metodă constă în atribuirea unui număr de membri "coadă" din seriile variate de scări zero, iar restul sunt aceleași pozitive. Dacă atribuirea greutăților zero se face pe baza rezultatelor valorilor curente ale observațiilor în afara domeniului specificat [a; b], adică:

vorbesc despre cenzurarea primului tip. Evident, în cazul în care numărul u de observații rămase în considerare este o variabilă aleatorie (u

Dacă greutățile zero sunt atribuite unei fracții fixe a unor valori extrem de mici și o fracție fixă ​​b de valori extreme extreme, atunci spunem că cel de-al doilea tip de nivel (a și b) este cenzurat. În acest caz, numărul de u rămas în considerarea observațiilor este o cantitate predeterminată și egală, în special, n (1-a-b).







Cercetătorul poate recurge la cenzurare, fie în mod obligatoriu, fie în mod voluntar. Forțat cenzurare din cauza condițiilor experimentale relevante: de exemplu, am pus pe testele distructive n produse, dar putem efectua un experiment pentru o T. perioadă limitată de timp Evident, va trebui să facă în acest caz o cenzurare unilaterală de primul tip, în care sunt excluse din analiză suplimentară a valorilor exacte ale durabilității (timpul până la eșecul) a tuturor acestor produse care nu sunt distruse în timp T. pe de altă parte, în evaluările clasă, construite din probe cenzurate, ora evaluarea poate fi găsit, cu toate că nu cel mai bun în cadrul populației generale a unui anumit tip, dar are o proprietăți de stabilitate favorabile ale calitățile lor bune în ceea ce privește aceste sau alte abateri de la o ipoteze a priori.

Acest concept este legat de situația când atributul x nu poate fi observată în orice zonă a valorilor sale posibile. De exemplu, dacă examinăm distribuția gospodăriilor în funcție de venituri, în condițiile unei anchete prin sondaj nu sunt în măsură să respecte familia cu media zero venituri, este mai mic decât un nivel predeterminat a (mii. Frecati.), Apoi, în astfel de cazuri spun că distribuția bordurate din punctul de stânga a. Spre deosebire de probe cenzurate în probe de la distribuții trunchiate nici măcar nu putem estima proporția de observații, care sunt situate în afara pragului de tăiere.

Lucrări de auto-decizie.

1. Firma de audit dorește să monitorizeze situația conturilor uneia dintre băncile comerciale. În acest scop, 50 de conturi sunt selectate aleator. Pentru 20 de conturi din 50 de persoane selectate, fluxul de numerar a avut loc în cursul lunii. Construiți un interval de încredere de 99% care estimează proporția conturilor din populația generală pentru care fluxul de numerar a avut loc în cursul lunii.

A) Construiți o histogramă, cumulă.

B) Calculați capacitatea medie a întreprinderilor.

B) Găsiți varianța, deviația standard, coeficientul de variație.

Explicați rezultatele, trageți concluzii.

4. Managerul companiei, dedicat de închiriere de mașini, vrea să estimeze valoarea medie a rula o masina timp de o lună. 280 vehicule deținute de companie, o metodă de eșantionare aleatorie selectată fără repetiții 30. Potrivit acestui eșantion a arătat că numărul de kilometri parcurși medie a vehiculului în luna 1342 km, cu o deviație standard de 227 km. Presupunând că o mașină aleatoare kilometraj variabilă, distribuite în mod normal, găsiți intervalul de încredere de 95%, estimarea kilometraj mediu de autoturisme doar parc pentru o lună.

5. Cu ajutorul re-selecției accidentale, conducerea companiei a efectuat un sondaj aleatoriu de 900 de angajați. Durata medie a muncii în firmă este de 8,70 ani, iar abaterea standard este de 2,70 ani. Printre cei chestionați au fost 270 de femei. Având în vedere durata de activitate a angajaților companiei distribuite conform legii obișnuite, stabiliți: a) cu o probabilitate de 0,95 interval de încredere, care va fi experiența medie de lucru a tuturor angajaților firmei; b) cu o probabilitate de 0,90 un interval de încredere care acoperă o proporție necunoscută de femei în întreaga echipă a companiei.

6. Proprietarul parcării se teme de înșelăciune din partea angajaților săi (păzind parcarea). Pe parcursul anului (365 de zile), proprietarul parcării a efectuat 40 de inspecții. Conform inspecțiilor, numărul mediu de automobile rămase peste noapte pentru protecție a fost de 400 de unități, iar abaterea standard a numărului lor este de 10 mașini. Presupunând că selecția este corectă-aleatorie, cu o probabilitate de 0.99, estimați, folosind intervalul de încredere, numărul mediu real de mașini lăsate peste noapte pentru pază. Sunt justificate temerile proprietarului parcului auto, dacă, potrivit rapoartelor gardienilor, numărul mediu de mașini rămase pentru noapte este de 395 de mașini?

7. Potrivit tabelului, examinați relația dintre veniturile familiilor X (mii de ruble) și cheltuielile acestora pentru consum.







Articole similare

Trimiteți-le prietenilor: