Dendrogramă, construită prin metoda comunicării complete a dendrogramului, construită prin metoda secțiilor

Luați în considerare un dendrogram construit de metoda Ward, deoarece adesea acesta este cel care dă clustere destul de compacte și bine separate:

Pe dendrograma construite de către Ward împărțit în 3 grupe, la fel ca în prima perioadă, similare între ele cu privire la nevoia de lucrători, a declarat organizațiile în serviciile publice de ocupare.







Primul grup include regiunile Orenburg, Samara, Kirov, Republica Cehă, Republica Udmurt.

A doua -, Ulyanovsk, regiunea Penza. Republica Mordovia și Republica Mari El.

Al treilea cuprinde regiunile Saratov și Nizhny Novgorod, precum și republicile Tatarstan și Bashkortostan, regiunea Perm

Metoda k-medii

Când folosim metoda k-mean, avem de asemenea 3 clustere care au fost obținute folosind metode ierarhice.

Elemente ale clusterului 1

Elemente de 2 clustere

Elemente de 3 clustere

Pentru a vedea diferențele dintre grupurile obținute, vom construi un grafic al mediilor, să comparăm clusterele medii și distanțele euclidane:

Dendrogramă, construită prin metoda comunicării complete a dendrogramului, construită prin metoda secțiilor






Parcela a fost reprezentată pe distanța medie și pe distanțele euclidane, care sunt prezentate în cifre:

Dendrogramă, construită prin metoda comunicării complete a dendrogramului, construită prin metoda secțiilor

Dendrogramă, construită prin metoda comunicării complete a dendrogramului, construită prin metoda secțiilor

Conform distanțelor euclidane prezentate în figură, este posibil să se observe cât de departe sunt amplasate clusterele.

Comparând graficele acestor două perioade, puteți observa că regiunea Samara, în ambele cazuri, se încadrează în clustere cu cea mai mică nevoie de lucrători. În consecință, pentru o perioadă de 14 ani, această regiune nu a avut o problemă în angajarea personalului în organizație.

Valorile medii ale clusterelor pe regiuni în timp, decât indicatorii medii pe PFD în aceleași perioade. Acest lucru se explică prin însumarea regiunilor PFD.

În prima etapă, atunci când fiecare obiect este un cluster separat, distanțele dintre aceste obiecte sunt determinate de măsura selectată. Cu toate acestea, atunci când mai multe obiecte sunt legate împreună, se pune întrebarea, cum ar trebui să se determine distanțele dintre clustere?

Comparați clusterele cu valoarea medie a acestui indicator pentru districtul federal Volga.

Valorile medii ale Districtului Federal Volga







Trimiteți-le prietenilor: