Cutie cu mustață

Cutie cu mustață

Graficul 2. Compararea densității distribuției și a casetei cu o mustață

O cutie cu mustață. Diagrama utilizată în statisticile descriptive descrie compact o distribuție de probabilitate unidimensională.







Acest tip de diagrama într-o formă convenabilă prezintă mediana (sau, dacă este necesar, media), quartilele inferioare și superioare, valorile eșantionului minim și maxim și emisiile. Câteva astfel de cutii pot fi desenate una lângă cealaltă pentru a compara o distribuție vizuală cu alta; ele pot fi plasate atât pe orizontală cât și pe verticală. Distanțele între diferitele părți ale casetei vă permit să determinați gradul de dispersie (dispersie) și asimetria datelor și să identificați emisiile.

Compactitatea prezentării informațiilor

Cartea "cutie cu mușchi", sau "diagrama", a fost dezvoltată de John Tewki în anii 1970. De fapt, o cutie cu mustață este o modalitate rapidă de a studia unul sau mai multe seturi de date într-o formă grafică. Acest grafic poate părea mai primitiv decât, de exemplu, histogramele. dar are unele avantaje. Aceasta necesită mai puțin spațiu și este, prin urmare, utilă în special pentru compararea distribuțiilor între mai multe grupuri sau seturi de date. În plus, o cutie cu mustață în forma sa originală este ușor de construit.

Dacă treilea grafic, care arată distribuția densității, nu se poate vedea cu adevărat nimic, și compara-l la al patrulea grafic care prezintă casetele cu o mustață, se poate estima cu ușurință mediana, cuartilele, o masura de variabilitate (dispersie) și asimetria în datele și să identifice emisiile. Asimetria informațională poate fi văzută nu numai în mediana ectopică la oricare capăt al cutiei, dar, de asemenea, pe diferite lungimea mustăților care vin din cutie.

Caseta cu "mustață" este foarte ușor de înțeles și, prin urmare, este adesea folosită în diverse publicații pentru a vizualiza date.

Granițele cutiei sunt primul și al treilea trimestru (percentilele 25 și 75), linia din mijlocul căsuței este mediană (al 50-lea percentil). Capetele mușchilor sunt marginile unui eșantion semnificativ din punct de vedere statistic (fără emisii) și pot fi determinate în mai multe moduri. Cele mai comune valori care determină lungimea "mustașei":







  • Valorile minime și maxime observabile ale datelor din eșantion (în acest caz nu există emisii);
  • Diferența dintre prima quartilă și una și jumătate distanțe interquartilată; suma celui de-al treilea cartel și distanțele între jumătate între jumătate. În formă generală, această formulă are forma

în care X 1> - mustăți limita inferioară, X 2> - superior mustăți limită, Q 1> - primul quartile, Q 3> - treimea inferioară, k - factor, valoarea cea mai frecvent utilizat este egal cu 1,5.

  • Media aritmetică pentru eșantion ± o abatere standard; [sursa nu este specificată 1134 zile]
  • Al 9-lea și al 91-lea percentil;
  • Al doilea și al 98-lea percentil.

Datele dincolo de limitele mușchilor (emisii) sunt afișate pe grafic sub formă de puncte, cercuri mici sau asteriscuri. Uneori graficul indică media aritmetică și intervalul de încredere ("notch" pe cutie). Uneori, crestăturile denotă intervalul de încredere pentru mediană.

Datorită faptului că nu există un acord comun cu privire la modul unic de a construi în mod specific o „cutie și mustăți“ la vederea unei astfel de calendar este necesară pentru a căuta informații în textul însoțitor, în ceea ce pe ce parametri construit caseta de complot.

Modificări ale unei cutii cu mustață

În ciuda simplității și a confortului, forma originală a unei cutii cu mustață are și unele dezavantaje. Unul dintre astfel de neajunsuri semnificative este lipsa de informații cu privire la numărul de observații pe eșantion pe grafic. Într-adevăr, complot caseta compară mediana, cuartilele, maxime și minime pentru diferite probe, dar dacă vrem să trage o concluzie cu privire la valoarea mediană generală pentru întregul set de probe, nu putem face acest lucru fără a recurge la calcule privind datele brute. In 1978, forma originală o cutie cu mustață a fost modificat McGill, Larsen și Tukey. Ei au oferit să ia în considerare dimensiunea eșantionului total desen cutii de diferite dimensiuni, precum și reprezentate pe intervalul de încredere pentru graficul median sub formă de pene divergente. Cu cât este mai mare cutia, cu atât este mai mare numărul de observații din proba pe care a fost construită această cutie. În ceea ce privește intervalul de încredere, este o notă pe fiecare cutie; în cazul în care degajările diferite cutii de rezultat; nu se suprapun, iar mediana lor este semnificativ statistic diferit.

O altă modificare a fost numită "histplot" (abreviat de la "plotul histogramei", cu limba engleză - "graph-histogram"). Acum, graficul prezintă densitățile de distribuție pentru cele trei puncte: primul, cel de-al patrulea trimestru. În consecință, în locul unui dreptunghi, "cutia" reprezintă acum două trapezoizi izocelule având o bază adiacentă.

Schimbarea ulterioară a fost numită "vaseplot" (din engleză - "graph-vase") din cauza asemănării vizuale a "cutiei" cu vaza. Acest grafic prezintă toate densitățile de probabilitate din primul până în al treilea trimestru. Zonele întunecate reprezintă intervalul de încredere al medianului.







Articole similare

Trimiteți-le prietenilor: