Felügyelt adatbányászati modellek folytonos célváltozóra

Leírás

A folyamat azt mutatja meg a Concrete Compressive Strength adatállomány esetén, hogy hogyan illeszthetünk felügyelt adatbányászati modelleket egy folytonos célváltozójú adathalmazra. Erre a feladatra egyaránt alkalmas a Regression operátor, amellyel lineáris regressziót illeszthetünk, de használhatjuk a döntési fák módszerét a Decision Tree operátorral vagy a neurális hálók módszerét a Neural Network operátorral. Mindegyik esetben egy folytonos mérési skálán mért célváltozót kell kiválasztani. A feladatban a célváltozó a Concrete compressive strength.

Bemenet

Concrete Compressive Strength [UCI MLR] [Concrete]

Az előfeldolgozási szakaszban elvégezzük az adatállomány partícionálást 60/20/20 százalékos arányban tanuló, ellenőrző és teszt adatállományra.

Kimenet

A kapott modellek összehasonlítása lényegesen eltér a diszkrét vagy bináris célváltozóknál használatos eszközökétől. A statisztikai mutatók közül az átlagos négyzetes hibát vagy annak négyzetgyökét illetve az információs kritériumokat tudjuk használni (AIC, SBC). Grafikus eszközként most nem áll rendelkezésre a lift görbe és az osztályozási oszlopdiagram. Ezek helyett használhatjuk az előrejelzések átlagait ábrázoló grafikonokat.

24.12. ábra - A kapott modellek statisztikái a teszthalmazon

A kapott modellek statisztikái a teszthalmazon

Az alábbi ábra azt mutatja, hogy a neurális háló és a lineáris regresszió viszonylag hasonlóan viselkedik.

24.13. ábra - A kapott modellek összehasonlítása az előrejelzések átlagai alapján

A kapott modellek összehasonlítása az előrejelzések átlagai alapján

24.14. ábra - A megfigyelt és az előrejelzett átlaggörbék viszonya modellekként

A megfigyelt és az előrejelzett átlaggörbék viszonya modellekként

Az alábbi görbéken az a jó ha minél közelebb vagyunk a diagonális egyeneshez.

24.15. ábra - A modell pontszámok alakulása

A modell pontszámok alakulása

Az összehasonlítások mellett egyenként is meg tudjuk vizsgálni az egyes modelleket. Alább a felépített döntési fa látható, amely az F statiszika alapján jön létre.

24.16. ábra - A folytonos célváltozóra kapott döntési fa

A folytonos célváltozóra kapott döntési fa

A neurális hálónál pedig megjeleníthetjük a neuronok súlyait.

24.17. ábra - A neurális háló tanítás utáni súlyai

A neurális háló tanítás utáni súlyai

Az eredmények értékelése

Mind a statisztikai mutatók, mind a grafikus eszközök azt mutatják, hogy a neurális hálós modell illeszkedik a legjobban.

Videó

Folyamat

sas_regr_exp3.xml

Kulcsszavak

felügyelt tanítás
folytonos célváltozó
döntési fa
lineáris regresszió
neurális háló

Operátorok

Data Source
Decision Tree
Model Comparison
Neural Network
Data Partition
Regression