Histograma (statistici)

Din punct de vedere grafic, histograma este construită după cum urmează. În primul rând, setul de valori pe care un element de probă îl poate primi este împărțit în mai multe intervale (cutii). Cel mai adesea, aceste intervale sunt aceleași, dar aceasta nu este o cerință strictă. Aceste intervale sunt reprezentate grafic pe axa orizontală, apoi se trasează un dreptunghi peste fiecare. Dacă toate intervalele au fost aceleași, atunci înălțimea fiecărui dreptunghi este proporțională cu numărul elementelor de eșantionare care intră în intervalul corespunzător. Dacă intervalele sunt diferite, atunci înălțimea dreptunghiului este selectată astfel încât suprafața sa să fie proporțională cu numărul de elemente de probă care intră în acest interval.







Să presupunem că X 1. .... X n. ..., \ ldots, X _, \ ldots> este un exemplu dintr-o distribuție. Definim o descompunere a liniei reale - ∞ . lăsa

- numărul de elemente de eșantionare care se încadrează în intervalul i. Apoi, funcția constantă pe bucată h

(x) = n i n Δ a i. Δ a i = a i - a i - 1 i = 1 .... k> (x) = >>>, \ Delta a_ = a_-a _, \; i = 1, \ ldot, k \;>. Se numește o histogramă normalizată.







Histograma normalizată este densitatea de probabilitate. În special:

Histograma distribuției absolut continue

Astfel, forma zonă, la un interval limitat histogramă normalizat (AI -. 1. ai], o _]> se apropie probabilitatea de a accepta valori cuprinse în acest interval, oricare dintre random variabilelor X j> Cu toate acestea, o histograma normalizată nu converg pointwise la densitatea de distribuție teoretică a acestora. aleatoare variabile.

Histogramele sunt utilizate în principal pentru vizualizarea datelor în stadiul inițial de prelucrare statistică.

Construcția histogramelor este utilizată pentru a obține o estimare empirică a densității de distribuție a unei variabile aleatorii. Pentru a construi o histogramă, intervalul de variație observat al unei variabile aleatorii este împărțit în mai multe intervale și se numără fracțiunea tuturor măsurătorilor care cade în fiecare dintre intervale. Valoarea fiecărei fracții, raportată la valoarea intervalului, este luată ca o estimare a valorii densității de distribuție pe intervalul corespunzător.

Esențial pentru construirea unei histograme este alegerea partiției optime, deoarece, odată cu creșterea intervalelor, detalierea distribuției densității este redusă, iar scăderea acurateței valorii acesteia scade. Pentru a selecta numărul optim de intervale n, regulile Sturges sunt adesea aplicate

De asemenea, de multe ori există o regulă care estimează numărul optim de intervale ca rădăcină pătrată a numărului total de măsurători:







Articole similare

Trimiteți-le prietenilor: