Procesarea rezultatelor testelor în stadiul actual de dezvoltare a teoriei testelor

Starea actuală a controlului pedagogic în sistemul de învățământ din Rusia este o combinație contrastanță a vechiului cu noul, subiectiv, cu un studiu obiectiv, oral, pe un sistem de evaluare cu cinci puncte, cu încercări de a introduce tehnologii de control. Metoda de testare este o direcție de dezvoltare rapidă la intersecția dintre pedagogie, teoria măsurătorilor, modelarea matematică, statisticile matematice și automatizarea. Introducerea și dezvoltarea unor astfel de teste vor aduce o contribuție semnificativă la procesul de reformare a sistemului național de învățământ și la integrarea sa în practica educațională mondială [11]. Având în vedere importanța testelor pentru procesul de învățare în școală, vom lua în considerare istoria dezvoltării sale și stadiul actual al metodelor de testare în țara noastră.







Istoria testării cunoștințelor și abilităților cu ajutorul diferitelor sarcini este de aproximativ 4 mii de ani. Datele arheologice sugerează că profesorii vechi școală sumeriene pentru a testa învățarea și consolidarea practicii materiale „lucrarea de referință“ de recunoaștere a textului trecut prin lucrările [12, c.73]. Cu toate acestea, primele lucrări științifice cu privire la testul teoretic acolo la începutul secolului XX, la intersecția de psihologie, sociologie, pedagogie și alte științe comportamentale (așa-numitele științe comportamentale). Unul dintre fondatorii teoriei testelor au fost oamenii de știință F. Galton [14], J. Kettel [13]. Problemele teoriei testelor sunt consacrate lucrărilor lui VS Avanesov, A. Anastasi, H. Zivert și alții [2, 3, 8].

Psihologii străini numesc teoria testelor psihometrice (psihometrie), iar profesorii - măsurarea pedagogică (măsurarea educațională). În limba rusă este obișnuit să numiți această știință un test. Testarea este știința testelor. Testul este un test scurt, standardizat, destinat atât obținerii unei evaluări cantitative obiective a rezultatelor învățării, cât și recunoașterii caracteristicilor și calităților personalității care ne interesează [6].

Testele pentru controlul obiectiv al cunoștințelor și aptitudinilor se numesc teste pedagogice. test de predare luate pentru a determina modul în care sistemul de conținut specific de locuri de muncă, forma specifică, care să permită în mod eficient și eficace măsurarea și evaluarea nivelului de pregătire a structurii studenților, controla rezultatul asimilării a procesului de învățare de cunoștințe și abilități. Testele pedagogice în scopul aplicării sunt împărțite în: 1) teste ale realizărilor, teste vocaționale; 2) teste orientate pe criterii; 3) teste orientate normativ; 4) teste de atestare; 5) teste pentru prezicerea rezultatelor învățării.

Există două forme principale de sarcini de testare: 1) sarcina formei închise - sarcina cu alegerea răspunsurilor la subiect, sarcina de a stabili corespondența și sarcina de a construi succesiunea corectă; 2) atribuirea unui formular deschis - o sarcină în care răspunsul este construit, tipărit sau formulat de către subiect însuși, adică în formularea sarcinii nu există răspunsuri posibile.

Dezvoltarea sarcinilor într-o formă de testare se realizează pe baza unor cerințe justificate în cadrul unei metodologii unificate. În cadrul metodologiei adoptate în practica mondială, următoarele cerințe se aplică acestor cerințe: 1) orice ambiguitate sau ambiguitate a formulărilor trebuie eliminată în textul cesiunii; 2) partea principală a sarcinii este formulată extrem de pe scurt (de regulă, nu mai mult de o propoziție); 3) toate variantele răspunsului la o sarcină trebuie să aibă aproximativ aceeași lungime; 4) din textul sarcinii, este necesar să excludem toate asociațiile verbale care ajută la alegerea răspunsului corect prin ghicitul.

În plus față de criteriile din stomatologia clasică, se disting următoarele principii pentru selectarea conținutului materialului de testare: 1) semnificație; 2) certitudine științifică; 3) conținutul testului este în concordanță cu nivelul științei actuale; 4) reprezentativitatea; 5) dificultatea crescândă a materialului didactic; 5) variabilitatea conținutului; 6) conținutul sistemic; 7) conținutul complex și echilibrat al testului; 8) relația dintre conținut și formă; 9) conformitatea scopului.

Durata testului este numărul de sarcini incluse în test. Teoria clasică a testelor afirmă: cu cât testul este mai lung, cu atât este mai fiabil. Dar practica de testare a auditorilor arată că, dacă testul este foarte lung, motivația și atenția se agravează. Durata optimă a testului este de 30-60 de sarcini. Fiecare test are un timp optim de testare - timpul de la începutul procedurii de testare până la momentul apariției oboselii. Variația caracteristicilor apariției oboselii este destul de mare - de la 20 la 100 de minute într-o singură grupă de vârstă. Principalele cauze ale oboselii: vârsta, motivația, monotonia muncii efectuate, caracteristicile individuale ale subiecților.

Durata minimă de testare depinde de forma, cantitatea și dificultatea sarcinilor. De exemplu, pentru a efectua o sarcină simplă de testare a unei forme închise, cu o alegere a unui element de la propus, este suficient 10-15 secunde [1].

Testele pedagogice care au apărut la începutul secolului XX au câștigat rapid popularitate în toate țările dezvoltate. Cu toate acestea, în URSS, până în anii '30, criticile lor contradictorii s-au desfășurat și apoi interzicerea lor totală. Și abia la începutul anilor '90, metodele de testare pedagogică pentru controlul cunoștințelor și abilităților au început să fie introduse în școlile și universitățile rusești. Testarea în Rusia este în prezent în curs de dezvoltare pe două nivele: proiecte 1) la nivel de stat sunt puse în aplicare pentru testarea sub egida Ministerului Educației: EGE, Teletesting, testarea centralizată de calculator; 2) la nivel corporativ, știința se dezvoltă rapid în cadrul instituțiilor de învățământ secundar, profesional și superior și centrelor de formare.







Odată cu dezvoltarea tehnologiei informației și a comunicațiilor, metodele de testare au atins un nou nivel: testarea prin utilizarea calculatoarelor personale și testarea on-line folosind Internetul. Utilizarea tehnologiei informației pentru evaluarea calității educației oferă o serie de avantaje față de desfășurarea monitorizării de rutină. În primul rând, este posibilă organizarea unui control centralizat care să asigure acoperirea întregului contingent dorit al studenților. Mai mult, computerizarea face posibilă controlul mai obiectiv, care nu depinde de subiectivitatea profesorului.

Dezvoltarea tehnologiei informației a contribuit la dezvoltarea și implementarea programelor practice de testare.

Analiza literaturii moderne științifice și metodologice [7], precum și informații de pe Internet [15, 16, 17] ne permit să formulăm principalele caracteristici pe care ar trebui să le dețină un sistem modern de testare software:
  1. Principala cerință pentru un sistem modern de monitorizare este de a rezuma conținutul, nivelul de complexitate, subiectul, tipul și orientarea subiectului a sarcinilor individuale de testare. O astfel de standardizare permite să nu se recurgă la crearea fiecărui test următor și la prelucrarea rezultatelor acestuia la serviciile programatorilor și, după ce a stăpânit un anumit sistem, să-și umple partea de conținut în diferite discipline, pe baza principiilor generale. Un grad ridicat de abstractizare din materialul de formare specific selectat pentru proiectarea testului determină proprietatea universalității;
  2. Sistemul de supraveghere ar trebui să cuprindă subsistemele din următoarele scopuri: crearea de teste (formarea unei bănci de întrebări și sarcini, strategii, să efectueze o anchetă și evaluare), testarea (prezentarea problemelor, manevrarea răspunsurilor), monitorizarea calității cunoștințelor de stagiari pe parcursul întregii perioade de a studia subiectului sau disciplina academică bazată pe înregistrarea progresului și rezultatele testelor într-o bază de date actualizată dinamic. Prezența unor componente (subsisteme) independente, dar interconectate: crearea unui test, monitorizarea rezultatelor, testarea determină proprietatea modulului;
  3. Datele din sistemul de monitorizare ar trebui să fie stocate centralizat pe serverul de la distanță. Accesul la date se face prin rețeaua locală. Prezența unei singure baze de date a întrebărilor pentru fiecare copie în execuție a programului determină proprietatea centralizării;
  4. Sistemul de monitorizare trebuie să diferențieze drepturile utilizatorilor pentru roluri tipice (student, profesor) pentru a împiedica testere să acceseze răspunsurile corecte ale testului și așa mai departe. - proprietatea de securitate;
  5. Sistemul de monitorizare poate avea capacitatea de a configura diagnosticele utilizând diferite modele de diagnosticare pentru a obține rezultatele determinate de ideea principală de a diagnostica, de exemplu, utilizarea unui model de testare adaptivă - proprietatea adaptabilității;
  6. În sistemul de monitorizare, prelucrarea matematică a rezultatelor testelor ar trebui să se efectueze, în special, calculul dificultății sarcinilor de testare - proprietatea de prelucrare a rezultatelor testului.

Sunt enumerate cerințele principale pentru sistemul de testare modernă a software-ului. De asemenea, următoarele caracteristici ar trebui să determine sistemul de diagnosticare modern: modurile de testare, tipurile de întrebări utilizate în test, selectarea aleatorie a sarcinilor, limitarea timpului de testare, importul sarcinilor de testare din documentul MicroSoft Word.

Astfel, în prezent, definiția dificultății sarcinilor de testare este una dintre cerințele unui sistem modern de testare a software-ului. Prelucrarea rezultatelor testelor cu determinarea dificultăților de atribuire a testelor este necesară pentru o abordare științifică în ceea ce privește compilarea testelor.

Din acest punct de vedere, un model interesant pentru procesarea testelor orientate către un criteriu este modelul cu un parametru al lui Rush [4, 10], care permite:
  • formarea unui test de la sarcini de grade diferite de dificultate;
  • face o concluzie destul de obiectivă cu privire la capacitatea persoanei de test pe baza numărului de probleme rezolvate;
  • pentru a trage o concluzie cu privire la probabilitatea de a rezolva o sarcină de un anumit nivel de dificultate.
De exemplu, la testarea a 20 de elevi folosind un test compus din 14 sarcini, s-au obținut următoarele rezultate:
  1. logit Scale prezentate mai jos în forma este umplută în mod inegal, testul constă în gradul mediu de dificultate a sarcinilor, nu este o sarcină cu un grad ridicat și scăzut de dificultate, la sarcini de 3, 11 și 10, 14 au aceeași dificultate;

Procesarea rezultatelor testelor în stadiul actual de dezvoltare a teoriei testelor

  • Pe baza rezultatelor testelor, se calculează abilitățile studenților, estimate în sistemul cu patru puncte:

    Procesarea rezultatelor testelor în stadiul actual de dezvoltare a teoriei testelor

  • Pe baza curbei caracteristice construite, se poate prezice soluția unei sarcini cu un anumit grad de complexitate:

    Procesarea rezultatelor testelor în stadiul actual de dezvoltare a teoriei testelor

    Cerințele reduse pentru software și hardware fac programul disponibil pentru școlile cu diferite niveluri de hardware despre software. În special, programul este testat la Facultatea de Informatica, Facultatea de învãþãtori de la Universitatea Pedagogică de Stat Chelyabinsk, noiembrie №94 Chelyabinsk.

    Astfel, în prezent, metodele de testare din țara noastră reprezintă o direcție importantă, promițătoare și în curs de dezvoltare pentru reformarea sistemului educațional. Una dintre întrebările principale pentru testare este prelucrarea rezultatelor testelor, în special, calculul dificultății de atribuire. Pentru o astfel de prelucrare a rezultatelor testului, se poate utiliza un model de testare cu un parametru al lui G.Rash. Programul de calculator, creat pe baza acestui model, permite automatizarea și obiectivitatea:
    1. Desfășurați procesul de testare prin determinarea dificultății sarcinilor, astfel încât testul să fie format din sarcini de diferite grade de dificultate.
    2. Interpretați rezultatele testelor. făcând o concluzie cu privire la capacitatea elevilor.
    3. Progresați rezolvarea unei sarcini de un anumit nivel de dificultate.






    Trimiteți-le prietenilor: