Statistici descriptive și reprezentare grafică a datelor în reviste medicale, omnibus rebus,

În literatura medicală, conceptele de interval median și interquartilat sunt utilizate pe scară largă, iar în diagramele de reprezentare a datelor. Mai jos vom oferi explicații pe această temă.







În publicațiile medicale descriu datele de multe ori pot fi găsite în reprezentarea valorilor numerice (de exemplu, tensiunea arteriala, nivelul hemoglobinei, vârsta, etc.) ca medie și deviație standard care este înregistrată ca M ± σ (de exemplu, 136 ± 12). Într-o astfel de înregistrare, "M" înseamnă media și σ este deviația standard. Această descriere a datelor este posibilă numai pentru caracterele a căror distribuție este normală (figura 1a) - cel mai adesea se referă la creștere, greutate, vârstă etc.

Fig. 1a. Un exemplu de distribuție normală (media 95,0, deviație standard 20,0 g / l). Barele gri arată distribuția nivelului de hemoglobină. Curba în formă de clopot deasupra coloanelor corespunde curbei normale de distribuție.

Cu o distribuție normală, toate valorile caracteristicilor pot fi aranjate sub forma unei curbe în formă de clopot simetric (figura 1a). Astfel, în termen de o deviație standard de la medie este de 68% din valorile caracteristice (de exemplu, în figura 1a, în intervalul de 75-115 este de 68% din toate valorile), în termen de două abateri standard de la medie este de 95% din valorile caracteristice (de exemplu, în Figura 1a este un interval de 55-135 g / l), iar în cadrul celor trei deviații standard este de 99,5% din toate valorile caracteristicilor.

Cu toate acestea, în medicină există, de asemenea, date, distribuirea cărora este diferită de cea normală. Un exemplu tipic este durata de urmărire a pacientului. La momentul inițial de observație, pacienții sunt întotdeauna mai mari și apoi numărul acestora scade din cauza pierderii din observație, deces și alte cauze. O astfel de distribuție este prezentată în figura 2a. Se poate observa că curba distribuției normale absolut nu corespunde imaginii reale reflectată de coloanele gri.

Fig. 2a. Un exemplu de distribuție diferită de cea normală: durata observării a fost de 4389 de pacienți.

Pentru astfel de distribuții, conceptele înseamnă și abaterea standard pierd o semnificație, deoarece oferă o descriere incorectă a distribuției variabilei. De exemplu, în Figura 2a, media este de 3,5 g, iar abaterea standard este de 3,2 ani. Se pare că 95% dintre pacienți trebuie să aibă o perioadă de observare de la "minus" 2,9 g la 9,9 g. Este destul de clar că nu există termeni negativi de observație. Chiar și în intervalul unei deviații standard, în care ar trebui să existe 68% din toate valorile, 80% din toate observațiile cad în mod clar. O caracteristică distinctivă a distribuției, care este diferită de cea normală, este distribuția asimetrică a elementului ("înclinarea") sau prezența unor valori care se află în mod clar în afara imaginii.

Distribuțiile altele decât cele normale sunt descrise, de obicei, utilizând intervalul median și interquartilat. Mediana este valoarea caracteristicii care împarte întreaga serie de valori în jumătate, adică jumătate din valorile caracteristicilor sunt mai mici decât media și jumătate sunt mai mult decât aceasta. Intervalul intervalului Interquartile este intervalul cuprins între 25 și 75 de procente, adică un sfert din toate valorile caracteristice va fi mai mic de 25 de percentile, iar un sfert va fi mai mare de 75 de procente. Astfel, intervalul intercuartil conține 50% "central" din valorile caracteristice.







Pentru timpul de observare prezentat în Figura 2a, media este de 2,5 ani, iar intervalul interquartil este de 1,0 până la 5,1 ani. Aceasta înseamnă că jumătate dintre toți pacienții au fost tratați cu hemodializă timp de 2,5 ani. Un sfert din toți pacienții - mai puțin de un an și un sfert din toți pacienții - mai mult de 5,1 ani. Această descriere caracterizează corect distribuția reală a trăsăturii.

În principiu, conceptul de interval median și interquartilat este destul de aplicabil distribuției normale. În acest caz, media va fi egală cu media, iar în intervalul interquartilat va fi ușor mai mică de 50% din toate valorile decât în ​​cadrul unei deviații standard (68% din toate valorile).

Pentru alte distribuții decât cele normale, afișarea grafică a datelor acceptate pentru distribuția normală nu este adecvată. Printre mai multe opțiuni potrivite pentru reprezentarea vizuală a datelor de orice distribuție, în opinia noastră, cele mai convenabile sunt diagramele box.

Figura 3a prezintă o diagramă cutie. Caseta este umbroasă în gri. Limita inferioară este de 25 de percentile, limita superioară fiind de 75 de procente. Linia orizontală negru care traversează cutia este mediana. După cum vedeți, mediana împarte caseta în două părți inegale - aceasta înseamnă că distribuția prezentată în Figura 3a este incorectă. Din cutie du-te "mustață". În exemplul din figura 3a inferior „mustăți“ reprezintă intervalul în care există 25% din valorile scăzute - de la 9 la 17. De notat că peste superioară „mustăți“ sunt doi termeni - emisii (așa cum rezultă din valoarea caracteristică eliberată în mare măsură de populația totală). Prin urmare, partea superioară "noi" reflectă intervalul în care există 22,2% (25% minus două valori, care sunt de 2,8%). Astfel, dacă nu există emisii, atunci "noi" reflectă intervalul în care 25% din toate observațiile sunt. În cazul în care emisiile sunt apoi „yc“ reflectă un interval care conține valori de la cvartilei la o valoare care este mai mică decât jumătate din lungimea dozatorului (în exemplul din Fig. 3a este un interval de 27-42 de ani). Figura 3a arată, de asemenea, că "mușchii" au lungimi diferite. Acest lucru sugerează de asemenea că distribuția vârstei la debutul hemodializei pentru această patologie este anormală.

Trebuie remarcat faptul că valorile medii și deviațiile standard sunt sensibile la emisii și pot varia considerabil cu valorile extreme din seriile de date. Descrierea datelor utilizând gama mediană și interquartilată evită influența emisiilor.

Diagrama cutie din figura 4a are aceleași "mușchi", dar mediana coincide cu cel de-al 25-lea percentil, iar în zona valorilor minime și maxime există emisii. Acest lucru sugerează că distribuția este anormală. Faptul că mediana coincide cu cel de-al 25-lea percentil este explicată foarte simplu. Presiunea diastolică este sub 75 mm. Hg. Art. au 19,1% dintre pacienți și o presiune de 80 mm Hg. - 35,2% dintre pacienți. Astfel, percentila mediană și cea de-a 25-a sunt 80 mm Hg.

Figura 4a prezintă, de asemenea, graficele utilizate pentru a reprezenta datele normale de distribuție. Una dintre ele demonstrează valoarea medie a tensiunii arteriale pentru același grup de pacienți și abaterea standard față de media (indicată în figura 2), iar cealaltă - media și două deviații standard (în figura 3). Media este de 84 mm. Hg. s, abaterea standard este de 12 mm Hg. Deși media diferă de mediană cu doar 4 mm Hg. pentru studiile privind populația, aceasta este o diferență foarte semnificativă, care poate duce la interpretarea incorectă a rezultatelor. În plus, deși limitele devierilor standard sunt apropiate de datele reale, ele nu reflectă eterogenitatea existentă în distribuția valorilor tensiunii arteriale.

Având în vedere că diagramele yaschichkovye reflectă și distribuția normală și anormală a valorilor extreme detectate și dispun de o reprezentare mai informativa a frecvenței de apariție a valorilor individuale, acestea sunt utilizate pe scară largă pentru afișarea de caractere numerice.

Plasați link-ul sau altul







Trimiteți-le prietenilor: