Az adatbányászat eredete

Az előző szakasz kihívásainak a találkozása hozta össze különböző tudományágak kutatóit azért, hogy elkezdjenek olyan hatékonyabb és skálázhatóbb eszközöket fejleszteni, amelyekkel kezelhetőek a különböző típusú adatok. Ez a munka, amely végül az adatbányászat tudományágban tetőzőtt, egy olyan módszertanon és algoritmusokon alapszik, amelyeket a kutatók már korábban is használtak. Különösen azokról a területekről merít ötleteket az adatbányászat, mint például (1) a mintavételezés, becslés és hipotézisvizsgálat a statisztikában és (2) a kereső algoritmusok, modellezési módszerek és tanuló eljárások a mesterséges intelligenciában, alakfelismerésben és gépi tanulásban. Az adatbányászat más területekről jövő ötleteket is gyorsan a magáévá tesz, beleértve az optimalizálást, evolúciós számítástudományt, információelméletet, jelfeldolgozást, vizualizációt és információkeresést.

Számos más terület is fontos támogató szerepet játszik. Különösen szükségesek az adatbáziskezelő-rendszerek a hatékonyabb tárolás, indexelés és lekérdezés feldolgozás támogatására. A nagy teljesítményű (párhuzamos) számítástudomány módszerei gyakran fontosak a hatalmas méretű adatállományok kezelésében. Az elosztott számítási módszerek szintén segíthetnek az adatállomány méretének kérdésében, és alapvetőek, amennyiben az adatok nem gyűjthetőek össze egy helyre.

Az 1.2. ábra az adatbányászat más területekkel való kapcsolatát mutatja.

1.2. ábra - Az adatbányászat mint több tudományág egyesülése

Az adatbányászat mint több tudományág egyesülése