Reprezentativitatea în sondaje

Este posibil să avem încredere în rezultatele sondajelor de opinie, în ce eșantion și în populația generală și în modul în care sondările în masă sunt politizate

Reprezentativitatea în sondaje

Noțiunea de "reprezentativitate" aplicată sondajelor sociologice - sondajele de opinie publică - are un efect aproape magic asupra oamenilor. Termenul "reprezentare" are, în afară de cel științific, și o semnificație politică clară.







Care este motivul? Întregul punct este acela că se presupune că eșantionul (grupul de persoane selectat pentru anchetă) poate reprezenta (reprezenta) întreaga populație. Populația totală în cazul anchetelor la nivel național este întreaga populație a țării. Acum, să ne imaginăm că vorbim despre o decizie politică - sprijinirea proiectului de lege sau votarea în alegeri. Cu ajutorul unui sondaj prin sondaj obținem un mecanism excelent pentru reprezentarea politică - un mecanism în care un grup mic de persoane poate reprezenta opinia sau poziția întregii populații a țării. Prin urmare, reprezentativitatea cercetării are un astfel de loc important.

Conceptul de reprezentativitate este folosit, desigur, nu numai în studiile politice. Termenul este folosit aproape întotdeauna când vine vorba de studii ample, fie în domeniul marketingului, al comportamentului economic sau al educației.

Metodologia anchetelor reprezentative

Cum poți, după intervievarea a 1.500 de persoane, să tragi concluzii despre toți rușii, care sunt mai mult de 140 de milioane (și chiar mai mult de 110 de milioane de alegători)? Tehnologia din spatele anchetelor reprezentative se bazează pe legi statistice. Cea mai apropiată bază este legea unui număr mare, sau teorema lui Bernoulli. Simplificat, sensul său poate fi transmis după cum urmează. Să presupunem că avem indicii, de exemplu, cantitatea de precipitații pe zi din Ekaterinburg în secolul al XX-lea. Dacă vom scrie toate valorile sale, împreună cu frecvența lor (numită o distribuție), și apoi să ia în mod aleatoriu un număr suficient de mare de cazuri (de exemplu, nu toate zilele secolului XX, dar destul de mult), vedem că distribuția în eșantionul nostru este foarte similar cu distribuția pentru întregul secol al XX-lea. Astfel, dacă selectăm unele unități din colecție, ele pot reprezenta într-adevăr întreaga populație și, de fapt, nu este nevoie să se colecteze date despre toate cazurile.

Imaginați-vă că din 143,5 milioane de ruși selectați aleatoriu cei 1,5 mii de oameni de care aveți nevoie. Apoi, de exemplu, ponderea managerilor de nivel mediu dintre ei va fi aproximativ egală cu proporția managerilor de nivel mediu din populație, ceea ce arată că eșantionul dvs. poate reprezenta întreaga populație. Ar putea fi acești doi indicatori foarte diferiți? De exemplu, printre ruși este de 14%, iar în eșantion va fi doar 1%? Teoretic, acest lucru este posibil, dar probabilitatea acestui lucru este atât de mică încât poate fi neglijată (aproximativ cum să întâlnești un dragon pe stradă).

În plus, cel mai plăcut lucru din această probabilitate nu este nici măcar faptul că este mic, dar că pentru procesele aleatorii această probabilitate poate fi calculată. Putem spune cu ce probabilitate eșantionul nostru se abate de la valoarea în populația generală cu 13% (ca în exemplul de mai sus), dar cu ceea ce, de exemplu, 2,5%. De obicei, cu toate acestea, nu invers: mai întâi a determina probabilitatea cu care ne-o dorim valoarea noastră nu se abate de la valorile din populația generală (cel mai adesea este fixat la 95%), și apoi uite ce amploarea variației într-o anumită dimensiune din eșantion. Această abatere se numește un interval de încredere, uneori se numește o eroare de eșantionare sau o eroare statistică - este adesea citată lângă rezultatele sondajului.

Astfel, probabilitatea deviației, mărimea deviației (intervalul de încredere) și mărimea eșantionului sunt corelate. Pe baza acestui aspect, formula de calcul a mărimii eșantionului este următoarea:

Reprezentativitatea în sondaje

unde n este mărimea eșantionului, Δ este intervalul de încredere, z este valoarea funcției de distribuție normală pentru probabilitatea de deviere dată (pentru o probabilitate de 5% această valoare este 1,96).







Aceasta este o formulă simplificată, în anchete reale se utilizează formule mai complicate. Această formulă poate de asemenea să nu reușească dacă valoarea indicatorului este foarte diferită de 50% (de exemplu, această formulă nu este adecvată pentru estimarea proporției pacienților cu o boală rară în țară).

Iată ce se întâmplă dacă înlocuim câteva valori în această formulă:

Cu alte cuvinte, dacă am luat un eșantion aleatoriu de ruși în mărime în 1600 și a evaluat orice caz, o astfel de dorința de a vota pentru o anumită politică, apoi cu probabilitate de 95% din estimarea noastră nu va fi diferită de disponibilitatea de a vota pentru el printre toți rușii mai mult de 2, 45%.

Reprezentativitatea în sondaje

Dimensiunea eșantionului

Deci, cu cât mărimea eșantionului este mai mare, cu atât mai probabil vom fi mai aproape de ponderea populației. S-ar părea că acest lucru înseamnă că trebuie să încercăm să aducem proba la 143500000. De fapt, după cum se poate observa din tabel, natura proceselor aleatoare este că, la un anumit punct probabilitatea de a cădea în intervalul începe să crească foarte lent (și vine de data aceasta destul de repede). După ce vom selecta cele 1,5 mii de unități, cu toate acestea am puternic sau a crescut mărimea eșantionului, probabilitatea ca valoarea eșantionului nostru se încadrează în valoarea din totalul populației, va crește foarte, foarte încet.

Reprezentativitate și exactitate

Pentru a înțelege semnificația conceptului de "reprezentativitate", să luăm în considerare un eșantion de 15 persoane. Destul de ciudat, dacă ați făcut-o accidental, este și el reprezentativ. În plus, puteți face o selecție într-o singură unitate. Imaginați-vă o cutie cu bile, de unde luați la întâmplare o minge. Dacă aceasta este o minge aleasă aleator, atunci ea va reprezenta, de asemenea, toate bilele care se află în această căsuță. Pur și simplu, le va reprezenta în mod incorect. De ce? Deoarece există o probabilitate foarte mare de a face o greșeală. Data viitoare putem extrage o altă minge și putem obține o altă idee despre bilele din cutie. A reprezenta în mod incorect înseamnă a avea o gamă largă de estimări.

În mod similar, 15 persoane reprezintă o populație generală, însă o reprezintă în mod incorect, deoarece eroarea, intervalul de încredere sunt foarte mari. Va trebui să adăugăm +/- 33% pentru a obține probabilitatea de 95% că vom ajunge la interval. Dacă suntem gata să recunoaștem acest lucru, atunci luăm 15 persoane, aflăm că 7 dintre aceștia sunt manageri la nivel mediu și apoi avem o estimare că 7/15 din agregat, adică 47% +/- 33%, este estimarea ponderea managerilor în populația generală și aceasta este o concluzie absolut corectă. Pur și simplu nu are nicio valoare. Acest lucru am putea spune fără examinare. Prin urmare, atunci când planificați un eșantion, este logic să ajungeți la un volum care să fie eficient în ceea ce privește raportul cost-eficiență.

Tot ceea ce sa spus este destinat să transmită o idee simplă, adesea nerealizată: dimensiunea eșantionului nu are legătură cu reprezentativitatea acesteia.

Un eșantion mic este inexact, dar poate fi în continuare reprezentativ. Volumele de eșantioane folosite astăzi în sondajele de masă din Rusia au aproape întotdeauna o precizie destul de mare.

Reprezentanța eșantionului nu este amenințată de volumul său, ci de o schimbare, adică o abatere de la principiul hazardului.

Încălcarea principiului hazardului

Dacă începem să alegem unitățile într-o manieră ne-aleatoare, eșantionul devine nereprezentativ. De exemplu, dacă ne împiedică să le selectăm în mod accidental. Imaginați-vă că dorim să selectăm bilele din caseta noastră în mod aleatoriu, dar se pare că unele dintre bile musc. Mecanismul prin care vom lua doar acele bile care ne sunt date în mână este un mecanism care încalcă aleatoriu și, prin urmare, încalcă reprezentativitatea. În acest caz, nu contează cât de mult avem bile sau scoase din cutie (chiar dacă vom lua toate bilele, care nu musca), vom avea un eșantion de conveniență, pentru că nu ia în considerare oricare dintre cei care mușcă - ei doar trec prin eșantionul nostru .

Cea mai mare problemă cu bilele de mușcătură este că acestea pot fi diferite de cele care vin în mâinile noastre și diferă exact în același mod în care ne interesează. Această situație se numește o eroare sistematică de eșantionare.

De ce reprezentativitatea este imposibilă

În notele la tabelele cu rezultatele sondajelor puteți vedea adesea că "dimensiunea eșantionului este de 1600 de persoane, eșantionul este reprezentativ după sex și vârstă". Din ceea ce sa spus mai sus, este evident că aceștia sunt doi parametri diferiți: indicarea reprezentativității nu este legată de mărimea eșantionului. De fapt, aici se înțelege că s-au efectuat anumite proceduri pentru a asigura o corespondență între eșantion și populație. De exemplu, pentru a asigura reprezentarea de gen, bărbații și femeile sunt recrutați în eșantion în aceleași rapoarte care există între ruși conform recensământului. Dar reprezentativitatea genului nu înseamnă reprezentativitatea, de exemplu, asupra opiniilor politice.

Cei care reduc problema reprezentării în sondaje de masă la statistici, uită că oamenii sunt bile foarte specifice. Există bile care scapă și se ascund. Există bile care mușcă. Ele nu sunt obiecte pasive, ele dau schimbare. Ei spun: "Nu vreau să particip la ancheta dvs.", încălcând astfel șansele. Prin urmare, în sensul strict al cuvântului, reprezentativitatea în sondajele de masă este, desigur, imposibilă în orice formă.

Un eșantion reprezentativ este o tehnologie împrumutată de sociologi din statistici. Prin urmare, ea poartă în mod inevitabil elemente ale imaginii matematice-statistice a lumii. Poate cel mai puternic este presupunerea că simpla sondaj de paie politic și neutru al sociologiei: participarea și neparticiparea la sondaj nu poartă un sens politic și nu este asociat cu alți parametri importanți sociologiei. Dar sondajele au devenit acum una dintre principalele instituții politice și a fost un intermediar cheie între marile corporații și consumatori. În aceste condiții, este deja imposibil să credem în sterilitatea lor politică. Cu toate acestea, știm încă puține lucruri despre modul în care sondajele sunt înțelese în societățile moderne și ceea ce reprezintă de fapt.

Reprezentativitatea în sondaje







Articole similare

Trimiteți-le prietenilor: