6. fejezet - Statisztikai eljárások

6.1. 6.1. Statisztikai becslések

6.1. Definíció. A statisztikát a paraméter torzítatlan becslésének nevezzük, ha .

A torzítatlanság azt jelenti, hogy a becslés a becsülendő paraméter körül ingadozik.

6.2. Definíció. A sorozatot a paraméter konzisztens (erősen konzisztens) becslésének nevezzük, ha sztochasztikusan (majdnem biztosan).

6.1. Példa. Legyen minta. Tegyük fel, hogy véges. Ekkor az -nek torzítatlan és konzisztens becslése. Valóban, nyilvánvaló.

majdnem biztosan teljesül a nagy számok erős törvénye miatt.

Ha és , akkor a torzítatlan és (erősen) konzisztens becslése. Valóban, -et már korábban láttuk. Továbbá, a Steiner-formulát használva

a nagy számok törvénye miatt.

Szavakban a fenti képletek az alábbit jelentik. Az empirikus közép az ismeretlen várható érték torzítatlan és konzisztens becslése. A korrigált empirikus szórásnégyzet pedig az ismeretlen elméleti szórásnégyzet torzítatlan és konzisztens becslése.

6.1.1. 6.1.1. A maximum-likelihood-becslés

A maximum-likelihood elv szerint az ismeretlen paraméter azon értékét fogadjuk el, amely mellett a bekövetkezett eredmény maximális valószínűségű.

6.3. Definíció. Legyen minta egy diszkrét eloszlásból, pedig a minta realizáció. Legyen az ismeretlen paraméter. Az

függvényt likelihood-függvénynek nevezzük. Az

függvényt pedig loglikelihood-függvénynek hívjuk.

A maximum-likelihood elv szerint -et kellene maximalizálni szerint. A maximum hely azonban pontosan egybeesik maximumhelyével, hiszen a természetes alapú logaritmus függvény szigorúan monoton növekvő. Így elegendő az maximumhelyét meghatározni.

6.2. Példa. Határozzuk meg a Poisson-eloszlás paraméterének maximum-likelihood becslését! Legyen minta paraméterű Poisson-eloszlásból:

A likelihood-függvény

a loglikelihood-függvény

A maximumhelyet deriválással határozzuk meg:

Innen

a maximum-likelihood becslés. (Ez természetes, hiszen itt éppen várható értéke.)

Az abszolút folytonos esetben a likelihood-függvény a mintaelemek együttes sűrűségfüggvénye.

6.3. Példa. Legyen minta exponenciális eloszlásból. Határozzuk meg maximum-likelihood becslését. Ekkor a sűrűségfüggvény

A likelihood-függvény

A loglikelihood-függvény

A maximum meghatározásához deriválunk:

Innen

a maximum-likelihood becslés. (Ez torzítatlan, hiszen itt a várható érték.)

Most a normális eloszlás paramétereinek becslésére térünk át.

6.4. Példa. Legyen minta az és paraméterű normális eloszlásból. A sűrűségfüggvények

így a loglikelihood-függvény

A megoldandó likelihood egyenletrendszer az alábbi

amelynek egyetlen megoldása és . Mivel

így a másodrendű parciális deriváltakból képzett mátrix az helyen

amely negatív definit, ezért maximum-likelihood becslése az paramétervektornak.

6.1.2. 6.1.2. Konfidencia intervallumok

Legyen ismeretlen paraméter, és két statisztika. Azt mondjuk, hogy a intervallum megbízhatósági szintű konfidencia intervallum -ra, ha

Itt szokásos értékei 0.1, 0.05, 0.01.

6.5. Példa. Szerkesszünk szintű konfidencia intervallumot a normális eloszlás várható értékére, ha a szórás ismert.

Legyen minta eloszlásból. Ekkor

Tehát megadható olyan , hogy

A fenti egyenlőtlenséget átrendezve kapjuk, hogy

Tehát

szintű konfidencia intervallum -re. Speciálisan esetén . Így a 90%-os konfidencia intervallum

Gyakorlatok

  1. Lássuk be, hogy a -nek konzisztens, de torzított becslése.

  2. Adjunk maximum-likelihood becslést a Pareto-eloszlás két paraméterére. A Pareto-eloszlás sűrűségfüggvénye ( és a paraméterek.)

  3. Adjunk konfidencia intervallumot a -eloszlás segítségével a normális eloszlás várható értékére, ha a szórás nem ismert.

  4. Legyen minta eloszlásból. Tegyük fel, hogy . Adjunk 95%-os konfidencia intervallumot -re.

Ellenőrző kérdések

  1. Mit nevezünk torzítatlan, illetve konzisztens becslésnek?

  2. Mi a maximum-likelihood-becslés?

  3. Mi a konfidencia intervallum?