7. fejezet - Osztályozási eljárások 3.

Regresszió

Tartalom

Lineáris regresszió
Osztályozás lineáris regresszióval
Lineáris regressziós osztályozó hatékonyságának kiértékelése
Lineáris regressziós osztályozó hatékonyságának kiértékelése 2

Lineáris regresszió

Leírás

A folyamat azt mutatja meg a Wine adatállomány esetén, hogy hogyan illeszthetünk regressziós modellt egy adott adathalmazra. Regressziós modellre alapozva is végezhetünk osztályozást, azonban ez a folyamat megmutatja, hogy önmagában a regressziós modell létrehozása nem elegendő ehhez. A regressziós modell alapján közelítő értékeket határozhatunk meg egy numerikus címke értékére, azonban ezek az értékek nincsenek megfeleltetve a a konkrét osztálycímkéknek. Ettől függetlenül viszont elmondható, hogy más osztályozási módszerekhez hasonlóan itt is tanuló- illetve teszthalmazra kell osztanunk az adathalmazt, és a tanulóhalmaz alapján kialakított regressziós modellt fogjuk alkalmazni a teszthalmazra.

Bemenet

Wine [UCI MLR]

Kimenet

A regressziós modell létrehozásához számos regresszió típus közül választhatunk, mint pl. a lineáris vagy a logisztikus regresszió. Ezek közül a lineáris regressziót használjuk a folyamatban. Ebben meghatározhatjuk például, hogy milyen módszer szerint kerüljenek kiválasztásra a jellemzők, vagy a minimális toleranciaszintet. Az így létrejövő lineáris regressziós modellt alkalmazhatjuk a teszthalmazra.

7.1. ábra - A lineáris regresszió operátor tulajdonságai

A lineáris regresszió operátor tulajdonságai

A tanulóhalmaz adatai alapján a következő regressziós modell jön létre:

7.2. ábra - Az eredményül létrejövő lineáris regressziós modell

Az eredményül létrejövő lineáris regressziós modell

Az eredmények értékelése

A tanulóhalmaz rekordjai alapján létrehozott regressziós modellt alkalmazva a teszthalmazra közelítő értékeket számíthatunk ki az egyes tesztrekordok címkéinek értékére nézve. Ezen közelítő értékek láthatóak az eredményül előálló címkézett adathalmazban:

7.3. ábra - A lineáris regressziós modell alapján kiszámított osztály predikció értékek

A lineáris regressziós modell alapján kiszámított osztály predikció értékek

Láthatjuk, hogy a közelítő értékek legtöbb esetben viszonylag jó becslést adnak, és az eredeti címkéhez közeli értéket vesznek fel, de önmagában ez még nem oldja meg az osztályozási feladatot. Ahhoz, hogy osztályozni tudjunk egy regressziós modell alapján, annak becsléseit osztálycímkéknek kell megfeleltetnünk.

Videó

Folyamat

regr_exp1.rmp

Kulcsszavak

osztályozás
regresszió

Operátorok

Apply Model
Linear Regression
Read AML
Split Data