Klaszterezés - K-medoid módszer

Leírás

A folyamat a Maximum Variance (R15) adatállományon mutatja be a K-mediod klaszterező algoritmus működését.

Bemenet

Maximum Variance (R15) [SIPU Datasets] [Maximum Variance]

Az adatállomány 600 kétdimenziós vektorból áll, melyek 15 klaszterbe tömörülnek. A pontok a (10, 10) koordinátájú központ körül helyezkednek el, a központtól távolodva egyre távolabb egymástól. A feladat nehézségét is ez adja, a központi klaszterek szinte egybeolvadnak.

11.5. ábra - Az adathalmaz

Az adathalmaz

Kimenet

11.6. ábra - A klaszterezés paramétereinek beállítása

A klaszterezés paramétereinek beállítása


A K-medoid módszer abban különbözik a K-közép módszertől, hogy a klaszter középpontjának egy létező pontnak kell lennie. A távolságfüggvény, illetve a k klaszterszám beállítása, és futtatása után láthatjuk, hogy hiába választottunk szofisztikáltabb távolságfüggvényt, az adatok elrendezése nem tette lehetővé a központi klaszterek pontos detektálását.

11.7. ábra - A klaszterezanalízis eredményeként létrejött klaszterek

A klaszterezanalízis eredményeként létrejött klaszterek


Az eredmények értékelése

A folyamat bemutatta, hogy nem minden adathalmaz ad lehetőséget tetszőleges klaszterelemzés használatára.

Videó

Folyamat

clust_exp2.rmp

Kulcsszavak

K-medoid módszer
adathalmazok sajátosságai
klaszteranalízis

Operátorok

k-Medoids
Read CSV