9. fejezet - Osztályozási eljárások 5.

Együttes módszerek

Tartalom

Az együttes módszerek bevezetése: a zsákolás
Az alaposztályozók számának hatása a zsákolás teljesítményére
Az alaposztályozók számának hatása az AdaBoost eljárás teljesítményére
Az alaposztályozók számának hatása a véletlen erdő teljesítményére

Az együttes módszerek bevezetése: a zsákolás

Leírás

A kísérlet az együttes módszerek használatát mutatja be a Bagging operátor szerepeltetésével. Egyetlen döntési tönk és 10 döntési tönk egy zsákolással tanított együttesének 10-szeres keresztellenőrzésből nyert átlagos osztályozási hibaarányát hasonlítjuk össze a Heart Disease adatállományon. A döntési tönkökhöz szennyezettségi mértékként a nyereségarányt használjuk.

Bemenet

Heart Disease [UCI MLR]

Megjegyzés

Az adatállományt Detrano, R. [Detrano et al.] adományozta a UCI Machine Learning Repository részére.

Kimenet

9.1. ábra - Egyetlen döntési tönk 10-szeres keresztellenőrzésből nyert átlagos osztályozási hibaaránya

Egyetlen döntési tönk 10-szeres keresztellenőrzésből nyert átlagos osztályozási hibaaránya

9.2. ábra - A zsákolás 10-szeres keresztellenőrzésből nyert átlagos osztályozási hibaaránya, ahol 10 döntési tönköt használtunk alaposztályozóként

A zsákolás 10-szeres keresztellenőrzésből nyert átlagos osztályozási hibaaránya, ahol 10 döntési tönköt használtunk alaposztályozóként

Az eredmények értékelése

10 döntési tönk egy zsákolással tanított együttesének átlagos osztályozási hibaaránya körülbelül 7%-kal jobb, mint egyetlen döntési tönké.

Videó

Folyamat

ensemble_exp1.rmp

Kulcsszavak

zsákolás
együttes módszerek
felügyelt tanulás
hibaarány
keresztellenőrzés
osztályozás

Operátorok

Apply Model
Bagging
Decision Stump
Map
Multiply
Performance (Classification)
Read CSV
X-Validation