Irodalmi megjegyzések

Az összegző statisztikákat részletesen tárgyalják a bevezető statisztikai könyvek, mint például [4957]. Feltáró adatelemzésre referencia Tukey klasszikus könyve [5068], valamint Velleman és Hoaglin könyve [5069].

Az alapvető vizualizációs módszerek könnyen hozzáférhetők, mivel a legtöbb adatbázis- és táblázatkezelő rendszer (Microsoft EXCEL [5075]), statisztikai program (SAS [5083], SPSS [5084], R [5081] és S-PLUS [5082]), illetve matematikai szoftver (MATLAB [5074] és Mathematica [5073]) integrált részei. Jelen fejezet ábráinak többsége MATLAB-bal készült. Az R statisztikai csomag ingyenesen letölthető, nyílt forráskódú szoftvercsomag, az R projekt része.

A vizualizációról szóló szakirodalom meglehetősen kiterjedt, több tudományterületet és több évtizedet fed le. Ennek a szakterületnek egy klasszikusa Tufte könyve [5067]. Spence könyve [5065], amely nagy hatással volt a fejezet vizualizációval foglalkozó szakaszaira, egy hasznos referencia az információ-ábrázolásról. Ez a könyv még számos olyan dinamikus vizualizációs módszert is tárgyal, amelyeket ebben a fejezetben nem érintettünk. A vizualizációval kapcsolatban érdeklődésre tarthat számot még a következő két könyv: Card és társai [87], valamint Fayyad és társai [5072].

Végül a világhálón szintén rengeteg információ érhető el az adatvizualizációról. Mivel a weboldalak állandóan változnak, a legjobb módszer ezek felkutatására, ha a keresőmotornak megadjuk a következő kifejezéseket: ``információvizualizáció'' (``information visualization''), adatvizualizáció (``data visualization'') vagy ``statisztikai ábrák'' (``statistical graphics''). Mindemellett még szeretnénk kiemelni Friendly-től Az adatvizualizáció galériáját (The Gallery of Data Visualization) [5061]. A hatékony grafikus megjelenítésre vonatkozó ACCENT-elvek szintén megtalálhatóak itt, vagy eredeti megjelenési helyükön, Burn cikkében [5058].

Számos grafikus módszer ismert, amelyeket akkor alkalmazhatunk, amikor az adatok Gauss- vagy más meghatározott eloszlást követnek. Olyan ábrák is ismertek, amelyek azt jelenítik meg, hogy statisztikusan mennyire szignifikánsak a megfigyelt értékek. Ezeket a módszereket itt nem tárgyaltuk, az Olvasó hivatkozást az előbb említett statisztikai és matematikai csomagokban talál.

A többdimenziós adatelemzési módszereket egy ideig változatos űrlapok alkalmazása jelentette. Az egyik ilyen űrlapot eredetileg Codd [5076], a relációs adatbázis-kezelés atyja, szerkesztette meg. Az adatkockákat Gray és társai [5077] vezették be, akik különböző módszereket adtak adatockák készítésére és kezelésére relációs adatbázis-kezelői környezetben. Shoshani [5079] statisztikai adatbázisokat hasonlít össze OLAP-módszerekkel. Az OLAP-ról bővebb információ található az adatbázis-kezelőket fejlesztő vállalatok dokumentációiban és több népszerű könyvben. Több adatbázis-tankönyv tartalmaz általános ismertetőt az OLAP-ról, gyakran az adattárházak kapcsán. Lásd például Ramakrishnan és Gehrke [5078] munkáját.