A C paraméter hatása a lineáris SVM teljesítményére (3)

Leírás

Ebben a kísérletben lineáris SVM-eket tanítunk a Spambase adatállományon, miközben a C paraméter értékét változtatjuk. A paraméter értékeként 2 egész kitevőjű hatványait használjuk: C = 2^n, ahol -8 <= n <= 5. Az adatállományt egy tanuló- és egy teszthalmazra osztjuk fel, az esetek 60%-ából képezzük a tanulóhalmazt, a többit pedig tesztelésre használjuk. Minden egyes SVM-hez meghatározzuk a tanuló- és a teszthalmazon mért hibaarányt valamint a tartóvektorok számát.

Bemenet

Spambase [UCI MLR]

Kimenet

8.13. ábra - A lineáris SVM osztályozási hibaaránya a tanuló- és a teszthalmazon a C paraméter értékének függvényében

A lineáris SVM osztályozási hibaaránya a tanuló- és a teszthalmazon a C paraméter értékének függvényében

8.14. ábra - A tartóvektorok száma a C paraméter értékének függvényében

A tartóvektorok száma a C paraméter értékének függvényében

Az eredmények értékelése

Az első ábra azt mutatja, hogy a tanulóhalmazon mért osztályozási hibaarány csökken, ha a C paraméter értéke nő. A C paraméter értékének növelésével a teszthalmazon mért hibaarány is csökken, amíg C el nem éri a 2-t. Azonban a paraméter értékének további növelése a tesztelési hibaarány csekély növekedését eredményezi.

A második ábra az mutatja, hogy a tartóvektorok száma körülbelül 50%-kal csökken, miközben a C paraméter értékét 2^-8-ról 8-ra növeljük. A paraméter értékének további növelése a tartóvektorok számának csekély növekedését eredményezi.

Videó

Folyamat

svm_exp4.rmp

Kulcsszavak

SVM
felügyelt tanulás
hibaarány
osztályozás

Operátorok

Apply Model
Log
Log to Data
Loop Parameters
Normalize
Performance (Classification)
Performance (Support Vector Count)
Read CSV
Split Data
Support Vector Machine (LibSVM)