10. fejezet - Asszociációs elemzés

Tartalom

Asszociációs szabályok kinyerése
Asszociációs szabályok kinyerése nem tranzakciós adathalmazból
Asszociációs szabályok hatékonyságának értékelése
Asszociációs szabályok hatékonysága – a Simpson paradoxon

Asszociációs szabályok kinyerése

Leírás

A folyamat azt mutatja meg az Extended Bakery adatállomány esetén, hogy hogyan tudunk asszociációs szabályokat kinyerni egy tranzakciós adathalmazból. A tranzakciós adathalmazokban a lehetséges elemek közül a jelenlévő elemeken van a hangsúly, tehát azokon az elemeken, melyek részét képezik az adott tranzakciónak, nem pedig azoknak, melyek hiányoznak belőle. Amennyiben egy ilyen tranzakciós adatállomány tömörítetlen ritka mátrix reprezentációban van, tehát minden rekord az összes lehetséges elemhez tartalmaz egy bináris értéket, az asszociációs szabályok kinyerése komolyabb transzformáció nélkül végrehajtható, csak arra kell ügyelnünk, hogy az egyes elemeket reprezentáló attribútumok bináris típusúak legyenek. Ezek alapján kinyerhetjük az adathalmazban előforduló gyakori elemhalmazokat, majd ezekből megkaphatjuk az érvényes asszociációs szabályokat.

Bemenet

Extended Bakery [Extended Bakery]

Kimenet

Az adatállomány 20000 rekordot tartalmazó verzióján alkalmazva az FP-Growth algoritmust megvalósító operátort a következő gyakori elemhalmazok jönnek létre:

10.1. ábra - A generált gyakori elemhalmazok listája

A generált gyakori elemhalmazok listája

Az eredmények értékelése

Ezek alapján a gyakori elemhalmazok alapján létrehozhatjuk a megfelelő asszociációs szabályokat. Beállíthatjuk, hogy milyen kritériumoknak megfelelő szabályokat kívánunk érvényesnek tekinteni – alapesetben egy elvárt megbízhatósági (konfidencia) szintet húzhatunk meg a szabályokhoz, de más értékek alapján is végezhetünk szűrést. A létrejött szabályok alapján mélyebb következtetések vonhatók le az adatok közötti összefüggéseket illetően, ennek segítésére elérhető többek között a létrejött szabályok táblázatos ábrázolása, melyben különböző szűrések segítségével válogathatjuk ki a számunkra érdekes szabályokat, például a kimenetel, vagy a megbízhatóság szerint:

10.2. ábra - A generált asszociációs szabályok listája

A generált asszociációs szabályok listája

A táblázatos ábrázolás mellett grafikus reprezentációt is használhatunk, az előzőéhez hasonló lehetséges szűrőfeltételekkel:

10.3. ábra - A generált asszociációs szabályok grafikus reprezentációja

A generált asszociációs szabályok grafikus reprezentációja

Videó

Folyamat

assoc_exp1.rmp

Kulcsszavak

gyakori elemhalmazok
asszociációs szabályok
tranzakciós adatok
bináris attribútumok

Operátorok

Create Association Rules
FP-Growth
Numerical to Binominal
Read AML