R verificarea statistică a apartenenței la o distribuție normală

Presupunerea că o variabilă aleatoare aparține legii normale de distribuție stă la baza multor metode și criterii statistice. În unele cazuri, respectarea acestei cerințe este esențială pentru aplicarea unei anumite metode.







În practică, întâlnim două variante de probleme în a verifica dacă distribuția aparține legii normale: pentru distribuțiile unidimensionale și multivariate.

Înainte de a utiliza funcțiile din pachete, trebuie să le instalați și să le încărcați mai întâi:

> install.packages (pkgs = "pkgname")> bibliotecă (pachet = "pkgname")

Pachetul fBasics conține, de asemenea, funcția normalTest (). care este "înfășurat" pentru mai multe funcții din același pachet. Criteriul necesar poate fi specificat folosind argumentul metodei. Sunt disponibile următoarele criterii:

  • sw - testul Shapiro-Wheelka
  • jb - criteriul Zhark-Ber
  • ks - testul Kolmogorov-Smirnov
  • testul da - D'Agostino
  • criteriul ad-Anderson-Darling.

Un exemplu de apelare a acestei funcții:

Pachetul lawstat conține, de asemenea, funcția sj.test (). care este realizarea criteriului rațional al normalității creat pe baza criteriului Shapiro-Wilk.

Pachetul TeachingDemos conține funcția SnowsPenultimateNormalityTest (). realizând un criteriu care nu este descris în literatură. Această funcție returnează numai nivelul semnificației statistice, indicând deviația distribuției de la legea normală.







Trucuri mici

Aplicarea funcțiilor la variabilele multiple

Cu aplicații-funcții, puteți aplica funcția la un vector, listă sau matrice în succesiune. Înainte de toate, trebuie să creați un tabel de date. Folosind funcția replică (), generăm 10 variabile care au o distribuție normală standard, care sunt combinate în clasa data.frame.

> DF <- data.frame(replicate(n = 10, rnorm(n = 100)))

Structura tabelului generat este următoarea:

Pentru a rezolva problema, puteți folosi funcția sapply (). Dar, mai întâi, trebuie să formăm puțin formatul de ieșire al funcției noastre: trebuie să extragem valorile criteriilor și nivelul lor de semnificație, deoarece rezultatul funcției shapiro.test () conține, de asemenea, informații care nu pot fi incluse în tabelul rezumativ, de exemplu informații despre metoda utilizată (criterii) și clarificarea naturii ipotezei alternative. Rezultatul testului Shapiro-Wilk este următorul:

> formiro.test (x) datele testului de normalitate Shapiro-Wilk: x W = 0.9903, p-value = 0.6882

Structura rezultatului funcției shapiro.test () este prezentată mai jos:

> str (formiro.test (x)) Lista statisticii 4 $: num num. 0.99. - attr (*, "nume") = chr "W" $ p.value. num 0.688 $ metoda. chr "testul de normalitate Shapiro-Wilk" $ data.name: chr "x" - attr (*, "class") =

După cum puteți vedea, pe lângă valorile criteriului și nivelul de semnificație, aici sunt informații despre metoda utilizată. Putem filtra ieșirea după cum urmează:







Articole similare

Trimiteți-le prietenilor: