14. fejezet - Adatforrások

Tartalom

Meglévő SAS adatállomány beolvasása
Adatok importálása CSV állományból
Adatok importálása Excel állományból

Meglévő SAS adatállomány beolvasása

Leírás

A kísérlet azt szemlélteti, hogy hogyan tudunk már meglévő SAS adatállományokat elérhetővé tenni az SAS® Enterprise Miner™ben az Input Data operátor segítségével. A kísérletben egy már korábban a SAS® rendszer vagy az SAS® Enterprise Guide™ által előkészített adatállományt fogunk beolvasni. A használandó fájl betöltéséhez tudnunk kell a fájl elérési útvonalát, amely lehet a lokális gép, de lehet egy SAS szerver is. A fájl beolvasását egy varázsló segítségével tudjuk megtenni, amely végigkalauzol az egész folyamaton. A beolvasott fájlt ezután a Sample operátorral vesszük használatba, amellyel egy részmintát válogatunk le a teljes, viszonylag nagy méretű adatállományból

14.1. ábra - Az eredményül kapott adatállomány metaadatai

Az eredményül kapott adatállomány metaadatai

Bemenet

Individual household electric power consumption [UCI MLR]

Kimenet

Egy, az eredeti adatállomány 10 százalékát tartalmazó adatállomány. A mintavételezésnél egyaránt megadhatunk abszolút és relatív mintanagyságot. Szintén beállíthatjuk az ún. Random Seed értéket, amellyel a pszeudo-véletlenszám generátor ciklusát tudjuk irányítani. Amennyiben különböző gépeken ugyanazt az értéket állítjuk be, úgy ugyanazt a véletlen mintát kapjuk eredményképpen. Szintén beállíthatjuk a rétegzett mintavételezés módját.

14.2. ábra - A Sample operátor beállításai

A Sample operátor beállításai

14.3. ábra - Az eredményül kapott adatállomány legfontosabb metaadatai és egy kis részlete

Az eredményül kapott adatállomány legfontosabb metaadatai és egy kis részlete

Az eredmények értékelése

Valahányszor újrafuttatjuk a folyamatot, az adatállomány aktuális állapotát fogja beimportálni a rendszer, így a Input Data operátor használható olyan adatállományok beolvasására és az arra épülő adatbányászati folyamatok újrafuttatására, amelyeket más SAS alapú rendszerek állandóan frissítenek.

Videó

Folyamat

sas_import_exp1.xml

Kulcsszavak

SAS adatállomány beolvasása
mintavételezés

Operátorok

Data Source
Sample