II. rész - RapidMiner

Tartalom

3. Adatforrások
Adatok importálása CSV állományból
Adatok importálása Excel állományból
AML állomány létrehozása adatállomány beolvasásához
Adatok importálása XML állományból
Adatok importálása adatbázisból
4. Előfeldolgozás
Problémás adatok kezelése – Hiányzó, inkonzisztens és duplikált értékek
Mintavételezés és aggregáció
Attribútumok létrehozása és szűrése
Attribútumok diszkretizálása és súlyozása
5. Osztályozási eljárások 1.
Osztályozás döntési fa segítségével
Döntési fás osztályozás alul- és túlillesztése
Döntési fás osztályozás hatékonyságának kiértékelése
Döntési fás osztályozás hatékonyságának kiértékelése 2
Döntési fás osztályozók összehasonlítása
6. Osztályozási eljárások 2.
Szabályalapú osztályozó használata (1)
Szabályalapú osztályozó használata (2)
Döntési fa átalakítása ekvivalens szabályhalmazzá
7. Osztályozási eljárások 3.
Lineáris regresszió
Osztályozás lineáris regresszióval
Lineáris regressziós osztályozó hatékonyságának kiértékelése
Lineáris regressziós osztályozó hatékonyságának kiértékelése 2
8. Osztályozási eljárások 4.
Perceptron használata lineárisan szeparálható bináris osztályozási probléma megoldására
Előrecsatolt neurális háló használata osztályozási probléma megoldására
A rejtett neuronok számának hatása az előrecsatolt neurális háló teljesítményére
Lineáris SVM használata lineárisan szeparálható bináris osztályozási probléma megoldására
A C paraméter hatása a lineáris SVM teljesítményére (1)
A C paraméter hatása a lineáris SVM teljesítményére (2)
A C paraméter hatása a lineáris SVM teljesítményére (3)
A tanulóhalmaz méretének hatása a lineáris SVM teljesítményére
A két spirál probléma megoldása nemlineáris SVM-mel
A magfüggvény szélesség paraméter értékének hatása az RBF magfüggvényű SVM teljesítményére
Az RBF magfüggvényű SVM optimális paraméter értékeinek keresése
SVM használata többosztályos osztályozási probléma megoldására
SVM használata regressziós probléma megoldásához
9. Osztályozási eljárások 5.
Az együttes módszerek bevezetése: a zsákolás
Az alaposztályozók számának hatása a zsákolás teljesítményére
Az alaposztályozók számának hatása az AdaBoost eljárás teljesítményére
Az alaposztályozók számának hatása a véletlen erdő teljesítményére
10. Asszociációs elemzés
Asszociációs szabályok kinyerése
Asszociációs szabályok kinyerése nem tranzakciós adathalmazból
Asszociációs szabályok hatékonyságának értékelése
Asszociációs szabályok hatékonysága – a Simpson paradoxon
11. Klaszterezés 1.
Klaszterezés - K-közép módszer
Klaszterezés - K-medoid módszer
Klaszterezés - DBSCAN módszer
Klaszterezés - Aggregáló módszer
Klaszterezés - Felosztó módszer
12. Klaszterezés 2.
Klaszterezés - Tartóvektor klaszterezés
Klaszterezés - Paraméterválasztás
Klaszterezés - Klaszterkiértékelés
Klaszterezés - Centroidok
Klaszterezés - Szövegklaszterezés
13. Kiugró értékek keresése (rendellenesség/anomália keresés)
Kiugró értékek keresése
Kiugró értékek felügyelet nélküli keresése
Kiugró értékek statisztikai alapú felügyelet nélküli keresése
Kiugró értékek keresése klaszterekben