A magfüggvény szélesség paraméter értékének hatása az RBF magfüggvényű SVM teljesítményére

Leírás

Ebben a kísérletben RBF magfüggvényű SVM-eket tanítunk különböző magfüggvény szélesség paraméter (gamma) értékek mellett a Pima Indians Diabetes adatállományon. A paraméter értékét 0,001-ről 5-re növeljük, miközben a C paraméter értékét konstans módon 1-nek vesszük, hogy egymással összevethető eredményeket kapjunk. Az adatállományt egy tanuló- és egy teszthalmazra osztjuk fel, az esetek 75%-ából képezzük a tanulóhalmazt, a többit pedig tesztelésre használjuk. Minden egyes SVM-hez meghatározzuk az osztályozási hibaarányát a tanuló- és a teszthalmazon.

Bemenet

Pima Indians Diabetes [UCI MLR]

Kimenet

8.21. ábra - Az SVM osztályozási hibaaránya a tanuló- és a teszthalmazon az RBF magfüggvény szélesség paraméter értékének függvényében

Az SVM osztályozási hibaaránya a tanuló- és a teszthalmazon az RBF magfüggvény szélesség paraméter értékének függvényében

Az eredmények értékelése

Az RBF magfüggvény szélesség paramétere megválasztható úgy, hogy az SVM tökéletesen osztályozza a teljes tanulóhalmazt. A modell ugyanakkor sajnos nem ad jó eredményt a tesztadatokon. Nyilvánvalóan modell túlillesztés történik. Meg kell jegyezni, hogy a lineáris SVM nem teljesít ilyen jól a tanulóhalmazon, az osztályozási hibaaránya 20% körül van.

Videó

Folyamat

svm_exp7.rmp

Kulcsszavak

SVM
felügyelt tanulás
hibaarány
osztályozás

Operátorok

Apply Model
Log
Loop Parameters
Normalize
Performance (Classification)
Read CSV
Split Data
Support Vector Machine (LibSVM)