Lineáris regressziós osztályozó hatékonyságának kiértékelése

Leírás

A folyamat azt mutatja meg a Spambase adatállomány esetén, hogy miként értékelhetjük ki egy olyan osztályozó hatékonyságát, pontosságát, melyet egy, az adott adathalmazra illesztett regressziós modell alapján hoztunk létre. Miután felépült a regressziós modell a tanulóhalmaz alapján, és alkalmazásával osztályoztuk a teszthalmazt, megvizsgálhatjuk, hogy milyen minőségű a végrehajtott osztályozás. Az így adódó értékelés alapján eldönthetjük, hogy az eredményül kapott osztályozás megfelel-e a célnak, avagy tovább kívánjuk javítani a meglévő modellünket, vagy esetleg olyan rossz az eredmény, hogy egy teljesen új modellre lenne szükség.

Bemenet

Spambase [UCI MLR]

Kimenet

A regressziós modell létrehozása után azt egy regresszió-alapú osztályozó operátorban kell elhelyeznünk, hogy tudjuk osztályozásra alkalmazni. Ugyanúgy, mintha önmagában használnánk az operátort, meghatározhatjuk például, hogy milyen módszer szerint kerüljenek kiválasztásra a jellemzők, vagy a minimális toleranciaszintet. Az így létrejövő lineáris regressziós osztályozó modellt alkalmazhatjuk a teszthalmazra.

7.7. ábra - A regressziós modellel osztályozó operátor alfolyamata

A regressziós modellel osztályozó operátor alfolyamata

A tanulóhalmaz adatai alapján a következő regressziós modell jön létre:

7.8. ábra - Az eredményként előálló lineáris regressziós modell

Az eredményként előálló lineáris regressziós modell

Az eredmények értékelése

A tanulóhalmaz rekordjai alapján létrehozott regressziós modellt alkalmazva a teszthalmazra konfidencia értékeket számíthatunk ki az egyes tesztrekordok adott csoporthoz tartozására nézve. Ezen konfidencia értékek alapján osztálybesorolást rendelünk az egyes rekordokhoz a teszthalmazban. Ennek megfelelően kiértékelhetjük, hogy hány rekordot sikerült helyesen osztályozni a regressziós modell alapján:

7.9. ábra - A regressziós modell alapján történt osztályozás teljesítményvektora

A regressziós modell alapján történt osztályozás teljesítményvektora

Videó

Folyamat

regr_exp3.rmp

Kulcsszavak

osztályozás
regresszió
teljesítmény
kiértékelés

Operátorok

Apply Model
Classification by Regression
Linear Regression
Performance (Classification)
Read AML
Split Data