Klaszterezés - DBSCAN módszer

Leírás

A folyamat a Compound adatállományon mutatja be a sűrűségalapú klaszterezés előnyeit a DBSCAN klaszterező algoritmuson keresztül.

Bemenet

Compound [SIPU Datasets] [Compound]

Az adathalmaz hat csoport 399 kétdimenziós vektorából áll. A csoportok a pontok sűrűségében különböznek, egy-egy halmaz körülölelhet más ponthalmazt is.

11.8. ábra - A változó sűrűségű csoportok

A változó sűrűségű csoportok

Kimenet

11.9. ábra - A módszer eredménye alapbeállításokkal

A módszer eredménye alapbeállításokkal


A folyamat már alapbeállításokkal is szép eredményt ért el, a hat klaszterből csupán egy klaszterben vétett hibát. Az epsilon, illetve a min points paraméter segítségével az eredmények tovább finomíthatóak, viszont a szóban forgó klaszter pontjai különböző sűrűségűek, így a tökéletes megoldás nem érhető el.

Az eredmények értékelése

Bemutattuk a DBSCAN algoritmus működését egy különböző sűrűségű csoportokból álló adathalmazon. Láthattuk a módszer hiányosságát is, amennyiben egy klaszteren belül különböző sűrűségű pontok is találhatóak, az algoritmus pontos működése nem garantált.

Videó

Folyamat

clust_exp3.rmp

Kulcsszavak

DBSCAN módszer
sűrűségfüggvény
klaszteranalízis

Operátorok

DBSCAN
Read CSV