Klaszterezés - Felosztó módszer

Leírás

A folyamat a Maximum Variance (R15) adatállományon keresztül mutatja be a felosztó hierarchikus klaszterelemzést.

Bemenet

Maximum Variance (R15) [SIPU Datasets] [Maximum Variance]

Az adatállomány 600 kétdimenziós vektort tartalmaz, melyek 15 különálló csoportot alkotnak. A feladat a csoportok ideális számosságának meghatározása, illetve azok megtalálása is.

11.13. ábra - A 600 kétdimenziós vektor

A 600 kétdimenziós vektor

Kimenet

11.14. ábra - Az alfolyamat

Az alfolyamat


A felosztó klaszterezés végrehajtásához szükséges egy tetszőleges klaszterező eljárás, mely segítségével a felosztás megtörténik. A kiinduló állapotban az összes pont ugyanabban a klaszterben van, majd a módszer folyamatosan bontja több részre a pontokat, míg végül az összes pont külön klaszterbe nem kerül. Az operátor megállapítja az ideális klaszterszámot, és a pontokat be is sorolja a klaszterekbe.

11.15. ábra - A klaszterelemzés riportja

A klaszterelemzés riportja


Jelen esetben az eljárás a klaszterszámot 63 csoportban állapította meg.

11.16. ábra - Az elemzés kimenete

Az elemzés kimenete


Majd be is sorolta őket ezekbe a halmazokba.

Az eredmények értékelése

Látható, hogy ugyan több klasztert hozott létre a módszer, de emiatt a központi klaszterek is jobban elkülönültek egymástól.

Videó

Folyamat

clust_exp5.rmp

Kulcsszavak

Felosztó módszer
felosztó hierarchikus klaszterezés
klaszteranalízis

Operátorok

k-Means
Read CSV
Top Down Clustering