A tanulóhalmaz méretének hatása a lineáris SVM teljesítményére

Leírás

A folyamat a tanulóhalmaz méretének hatását szemlélteti a lineáris SVM teljesítményére az Adult (LIBSVM) adatállomány esetén. A kísérletben a tanulóhalmaz méretét növeljük és minden egyes lépésben egy SVM-et tanítunk. Az SVM-ek mindegyikéhez a következő teljesítményjellemzőket határozzuk meg:

  • osztályozási hibaarány a tanulóhalmazon,

  • osztályozási hibaarány a megfelelő teszthalmazon,

  • a tartóvektorok száma,

  • a lineáris SVM tanításához szükséges CPU végrehajtási idő.

Bemenet

Az Adult adatállomány [UCI MLR] a LIBSVM [LIBSVM] honlapjáról elérhető diszkretizált és binarizált változata.

Kimenet

8.15. ábra - A lineáris SVM osztályozási hibaaránya a tanuló- és a teszthalmazon a tanulóhalmaz méretének függvényében

A lineáris SVM osztályozási hibaaránya a tanuló- és a teszthalmazon a tanulóhalmaz méretének függvényében

8.16. ábra - A tartóvektorok száma a tanulóhalmaz méretének függvényében

A tartóvektorok száma a tanulóhalmaz méretének függvényében

8.17. ábra - Az SVM tanításához szükséges CPU végrehajtási idő a tanulóhalmaz méretének függvényében

Az SVM tanításához szükséges CPU végrehajtási idő a tanulóhalmaz méretének függvényében

Az eredmények értékelése

Az első ábra azt mutatja, hogy az osztályozási hibaarány a tanuló- és teszthalmazon nagyjából ugyanaz a vizsgált tartományon a tanulóhalmaz méretétől függetlenül.

A második és a harmadik ábra azt mutatja, hogy a tartóvektorok száma és a CPU végrehajtási idő lineárisan nő a tanulóhalmaz méretével.

Videó

Folyamat

svm_exp5.rmp

Kulcsszavak

SVM
felügyelt tanulás
hibaarány
osztályozás
keresztellenőrzés

Operátorok

Apply Model
Extract Macro
Generate Attributes
Log
Log to Data
Loop Files
Normalize
Parse Numbers
Performance (Classification)
Performance (Support Vector Count)
Provide Macro as Log Value
Read Sparse
Remove Duplicates
Sort
Support Vector Machine (LibSVM)