Asszociációs szabályok hatékonyságának értékelése

Leírás

A folyamat azt mutatja meg a Titanic adatállomány esetén, hogy amennyiben asszociációs szabályokat nyerünk ki egy adathalmazra vonatkozóan, hogyan tudjuk ellenőrizni azok használhatóságát, hatékonyságát. Az asszociációs szabályok kinyerése után ellenőrizhetjük azok támogatottságát, illetve az osztályozási feladatokhoz hasonlóan vizsgálhatjuk, hogy az adatállomány eredeti értékeit milyen mértékben tudjuk előrejelezni a létrejött szabályok alapján. Ezek alapján olyan következtetéseket vonhatunk le, melyek segítségével eldönthetjük, hogy az eredményül kapott asszociációs szabályok megfelelnek-e a célnak, avagy tovább kívánjuk javítani a meglévő szabályainkat, vagy esetleg a meglévő szabályok olyan gyenge összefüggéseket tártak fel, hogy egy teljesen új megközelítésre lenne szükség.

Bemenet

Titanic [Titanic]

Kimenet

Az adatállomány segítségével azt vizsgálhatjuk, hogy a Titanic utasainak kora és neme, illetve az, hogy milyen osztályon utaztak, hatással volt-e a túlélésükre. A változók megfelelő konverziója után feloszthatjuk az adathalmazt egy tanuló- és egy teszthalmazra, majd a teszthalmazon alkalmazva a tanuló halmaz alapján kinyert asszociációs szabályokat, meghatározhatjuk, hogy az eredményül kapott asszociációs szabályok mennyire használhatóak. A konverzió során a létrehozott attribútumok későbbi hivatkozhatóságához használnunk kell a következő paramétert:

10.13. ábra - Operátor beállításai a szükséges adatkonverzióhoz

Operátor beállításai a szükséges adatkonverzióhoz

Ezután ahhoz, hogy az általános teljesítménymérő operátorral ki tudjuk értékelni a szabályok alkalmazásának hatékonyságát, a számunkra érdekes attribútum (ez esetben a Survived_1, mely azt jelzi, hogy az adott utas túlélte a hajószerencsétlenséget) eredeti és előrejelzett értékét nominális típusúra kell konvertálnunk, majd arról is gondoskodnunk kell, hogy egyformán legyenek lekódolva az értékeik:

10.14. ábra - A label szerepkör kiosztása a teljesítményméréshez

A label szerepkör kiosztása a teljesítményméréshez

10.15. ábra - A prediction szerepkör kiosztása a teljesítményméréshez

A prediction szerepkör kiosztása a teljesítményméréshez

10.16. ábra - Operátor beállításai a teljesítményméréshez szükséges adatkonverzióhoz

Operátor beállításai a teljesítményméréshez szükséges adatkonverzióhoz

Az eredmények értékelése

A megfelelő szerepkörök beállítása után a teljesítménymérő operátor már automatikusan elvégzi a hasonlításokat, és ez alapján kiértékeli a szabályok alkalmazásának hatékonyságát. A folyamat futtatása a következő, az utasok túlélésére vonatkozó szabályokat adja eredményül:

10.17. ábra - A túléléssel kapcsolatos generált asszociációs szabályok grafikus reprezentációja

A túléléssel kapcsolatos generált asszociációs szabályok grafikus reprezentációja

10.18. ábra - A túléléssel kapcsolatos generált asszociációs szabályok listája

A túléléssel kapcsolatos generált asszociációs szabályok listája

Itt láthatjuk, hogy bár számos következtetés jött létre az utasok túlélését illetően, a szabályok támogatottsága igen alacsony. Ebből következik, hogy a szabályok csak viszonylag speciális esetekben lesznek alkalmazhatóak, nem pedig általános érvényűen, tehát egyes esetekben nem lehet majd ezekre alapozva döntést hozni. Ez látható a hatékonysági értékelésnél megjelenő gyenge értéken is:

10.19. ábra - A generált asszociációs szabályok alkalmazásának teljesítményvektora

A generált asszociációs szabályok alkalmazásának teljesítményvektora

Ennek egyik oka lehet, hogy a szabályok kinyerése során valamely egyéb tényezőt nem sikerült figyelembe venni, mely befolyásolhatja az asszociációs szabályok által feltárt összefüggéseket. Ezek feltárása után adott esetben jobb eredmény érhető el.

Videó

Folyamat

assoc_exp3.rmp

Kulcsszavak

gyakori elemhalmazok
asszociációs szabályok
teljesítmény
támogatottság

Operátorok

Apply Association Rules
Create Association Rules
Discretize by User Specification
FP-Growth
Multiply
Nominal to Binominal
Performance
Read AML
Set Role
Split Data