Modele cu variabile dependente

Trunchierea are loc atunci când datele sunt selectate dintr-un volum mai mare de un subset de date (observații), de exemplu, studiul a considerat familiile cu venituri cu venituri sub sau peste un anumit nivel (de exemplu, linia sărăciei).







În loc de trunchierea probelor, se poate folosi și cenzura. În special, întregul eșantion este luat în considerare în cercetarea veniturilor, însă se presupune că familiile cu venituri mai mari sau inferioare unui anumit nivel de venit sunt la același nivel. Consecința cenzurii și trunchierii eșantioanelor este distorsiunea valorilor parametrilor eșantioanelor distribuțiilor, în special așteptările matematice și variațiile lor. În consecință, concluziile obținute pe baza probelor trunchiate și cenzurate ar trebui diseminate foarte atent populației generale.

Modele de probe trunchiate

Să presupunem că o distribuție trunchiată face parte dintr-o distribuție nerestricționată care se situează deasupra sau sub un anumit prag.

Densitatea unei variabile aleatorii continue z. trunchiat deasupra nivelului b. se determină în conformitate cu următoarea expresie:

Expresia (10.136) rezultă din formula probabilității condiționale. De fapt, probabilitatea condiționată că o variabilă aleatoare z va prelua o anumită valoare sub condiția că z

ò ò /ò

Diferențierea laturilor stângi și drepte ale expresiei (10.137) cu privire la z. obținem (10.136).

În multe studii practice se presupune că variabila aleatoare z este distribuită conform legii normale. În acest caz, probabilitatea ca z> b să fie determinată conform următoarei expresii:

unde m și s reprezintă așteptarea și abaterea standard a variabilei aleatoare z, respectiv; b = (b-m) / s; Φ (.) Este valoarea funcției standard normale de distribuție integrală la punctul corespunzător.

Apoi, conform expresiei (10.136), funcția de densitate a distribuției normale trunchiate este definită ca:

unde j (.) este funcția standard de distribuție normală.







În Fig. 10.6 sunt grafice ale funcțiilor densităților unei distribuții normale standard trunchiate cu m = 0 și s = 1 pentru b = -0,5; 0; 0.5. Din graficele prezentate în această figură rezultă că trunchierea "ridică" funcția de densitate pe secțiunea rămasă după trunchierea peste graficul acestei funcții a distribuției "ne-trunchate".

În cele ce urmează, o variabilă aleatoare cu o distribuție trunchiată va fi numită variabilă aleatoare trunchiată.

Rețineți că așteptările matematice și varianța variabilei aleatorii trunchiate sunt determinate în conformitate cu următoarele expresii:

M [z | z> b] =ò

D [z | z> b] =ò

Desfasurarea integrării în (10.140) - (10.141), având în vedere faptul că funcția de densitate f definită prin expresia (10.139), descoperim că așteptarea și variația z variabilei aleatoare trunchiat, respectiv (Z z> b.):

Modele cu variabile dependente

Ris.10.8. Media condiționată ca funcție a gradului de trunchiere.

Să presupunem că dependența unor variabile aleatorii yt. din valorile factorilor care o afectează, pot fi reprezentați după cum urmează:

unde xt este vectorul variabilelor independente care afectează variabila yt; a este un vector de parametri; et este eroarea modelului pentru care se presupune că acesta este distribuit conform legii normale standard cu așteptare matematică zero și variație constantă, et

Variabila yt. descrisă de expresia (10.148), este distribuită în conformitate cu legea normală cu așteptarea matematică mt = a ¢ s xt și varianța s 2.

Luați în considerare distribuția variabilei dependente yt, cu condiția ca valorile observate ale yt să depășească un anumit prag b. Conform expresiei (10.142), rezultă că așteptarea matematică condiționată yt pentru model (10.148) este o funcție neliniară a lui xt și a. și este definită ca

M [yt | yt> b] = a ¢ s xt +

Rescriim expresia (10.149) folosind funcția de eșecuri l (bt) (a se vedea expresia (10.144)):

Având în vedere forma expresiei (10.150), estimăm magnitudinea efectului marginal al factorilor xt pentru cazul unei probe reduse:

Deoarece pentru fiecare set de factori xt relația 0

Observăm că, datorită specificității expresiei (10.150), eroarea et a modelului (10.146) construită pentru proba trunchiată are așteptări s × l (bt). În acest caz, varianța erorii et este determinată după cum urmează:

Astfel, din expresiile (10.150) și (10.152), că estimările parametrilor modelului (10.148), definite pe baza variabilei dependente eșantion trunchiate (yt> b sau yt





Trimiteți-le prietenilor: