De ce este necesar să se normalizeze caracteristicile cantitative

un1t. această procedură se poate face în moduri diferite. Opțiunea cea mai simplă este să se scadă media și să se împartă cu diferența dintre valoarea maximă și valoarea minimă. Dar este rău că în cazul unei ejecții accidentale (de exemplu, pentru o primă variabilă a apărut un punct cu o valoare de 1000) acest tip de procesare nu va avea succes.






A doua opțiune este scăderea mediei și împărțirea cu deviația standard. Această metodă este mai rezistentă la emisii. Însă deviația medie și standard sunt sensibile la emisii.
A treia opțiune (normalizare robustă) este de a elimina mediana și de a împărți diferența dintre primul și al patrulea trimestru. Această opțiune practic anulează efectul emisiilor.







Vreau să corectez puțin. În metodele metrice, după cum sa menționat mai sus, semnele trebuie să fie normalizate (în intervalul [0; 1]) astfel încât să contribuie la aceeași contribuție.
Modelele liniare (aceasta include SVM) caracteristici trebuie sa standardizeze (scade media și împărțiți prin deviația standard a mediei a fost zero, iar unitățile de deviație standard). Pentru că:
Una dintre cele mai importante ipoteza atunci când este vorba de modele liniare, ale căror parametri sunt estimate mai mici pătrate, este faptul că reziduurile de model independent (adică, necorelate), și au o distribuție normală cu media 0 și unele σεσε deviație standard fixă, t .E. e_i ~ N (0, σ).
Diagnosticarea modelelor de regresie liniară. Partea 1







Trimiteți-le prietenilor: