3. fejezet - Adatforrások

Tartalom

Adatok importálása CSV állományból
Adatok importálása Excel állományból
AML állomány létrehozása adatállomány beolvasásához
Adatok importálása XML állományból
Adatok importálása adatbázisból

Adatok importálása CSV állományból

Leírás

A folyamat azt szemlélteti, hogy hogyan tudunk adatokat importálni CSV állományokból a Read CSV és az Open File operátorok segítségével. A kísérletben egy valósidejű földrengés adat feed-et használunk, melyet az USGS szolgáltat CSV formátumban. Először is letöltjük a feed-et, hogy be lehessen importálni a RapidMiner-be a Read CSV operátor Import Configuration Wizard funkciójával. A varázsló lépésről lépésre vezeti végig a felhasználót az importálás folyamatán és segíti az operátor paramétereinek helyes beállításában. Miután sikeresen importáltuk a feed lokális másolatát, az Open File operátor a folyamathoz való hozzáadásával átválthatunk az élő feed-re.

Bemenet

Az Egyesült Államok Földtani Szolgálata (United States Geological Survey, röviden USGS) valós idejő földrengés adat feed-eket szolgáltat a Földrengés Veszélyeztetettségi Program (Earthquake Hazards Program) weboldalon. Az adatok különféle formátumokban állnak rendelkezésre, beleértve a CSV-t is. A kísérlet az elmúlt 30 nap legalább 1 magnitúdójú földrengéseinek CSV formátumú feed-jét használja a http://earthquake.usgs.gov/earthquakes/feed/v1.0/csv.php címről. A feed 15 percenként frissül.

Kimenet

Egy, a CSV feed-ből importált adatokat tartalmazó ExampleSet.

3.1. ábra - Az eredményül kapott ExampleSet metaadatai

Az eredményül kapott ExampleSet metaadatai

3.2. ábra - Az eredményül kapott ExampleSet egy kis részlete

Az eredményül kapott ExampleSet egy kis részlete

Az eredmények értékelése

Valahányszor futtatjuk a folyamatot, az az élő adatokat fogja beolvasni a webről.

Videó

Folyamat

import_exp1.rmp

Kulcsszavak

adatok importálása
CSV

Operátorok

Open File
Read CSV