6.3. 6.3. Khi-négyzet próbák

6.3.1. 6.3.1. Tiszta illeszkedésvizsgálat

Legyen egy teljes eseményrendszer. Legyenek adott számok, . Döntsünk a

nullhipotézis érvényességéről.

Hajtsuk végre az eseményrendszert tartalmazó kísérletet -szer, egymástól függetlenül. Jelölje az bekövetkezései számát. Képezzük a

statisztikát. Ha fennáll, akkor aszimptotikus eloszlása .

A statisztika szerkezete:

A statisztika kicsiny volta utal arra, hogy a megfigyelt értékek közel vannak azokhoz, melyeket a fennállása esetén várunk. Tehát ha kicsi, akkor -at elfogadjuk. Ha nagy (azaz meghaladja a kritikus értéket) akkor -at elvetjük. Adott szinthez a kritikus értéket a eloszlás táblázatából határozhatjuk meg. A -próba nagy esetén alkalmazható, mivel a statisztika eloszlása csupán aszimptotikusan .

6.7. Példa. Állapítsuk meg, hogy egy dobókocka szabályos-e. Jelölje azt az eseményt, hogy a kockán -t dobunk (). Ekkor

A kocka 600-szori feldobásakor az alábbi eredmény adódott:

( jelöli gyakoriságát). A -statisztika:

fennállása esetén a statisztika aszimptotikusan eloszlású. -at akkor vetjük el szinten, ha meghaladja az szinthez tartozó kritikus értéket. A kritikus értéket a eloszlás táblázatából keressük ki. esetén ez 9.236, esetén 15.09, míg esetén 20.51. Tehát -at valamennyi használatos szinten elvetjük.

6.3.2. 6.3.2. Az illeszkedésvizsgálat végrehajtása

A kiinduló probléma az, hogy a megfigyelt valószínűségi változó eloszlásfüggvénye egyenlő-e az előre megadott eloszlásfüggvénnyel. Fogalmazzuk át a feladatot az előző sémára. Osszuk fel értékkészletét páronként diszjunkt részhalmazokra. Legyen az az esemény, hogy értéke -be esik. Ekkor az a teljes eseményrendszer, amelyre az előző eljárást alkalmazni fogjuk. Jelölje a valószínűséget abban az esetben, ha az valódi eloszlásfüggvénye. Az így megadott értékek szerepelnek a próbastatisztikában.

Figyeljük meg -et -szer egymástól függetlenül, jelölje az gyakoriságát. Az így adódó számokkal készítsük el a

statisztikát. Ha meghaladja az szinthez tartozó kritikus értéket, akkor szinten elvetjük azt a hipotézist, hogy eloszlásfüggvénye .

6.8. Megjegyzés. Mivel a statisztikánk esetén vett határeloszlása , így az eljárás nagy -ekre alkalmazható. A kézikönyvek azt ajánlják, hogy a minta elemszáma olyan nagy legyen, hogy minden gyakoriság legalább 6-nál (más művek szerint 10-nél) nagyobb legyen. Viszont a mintaelemszám általában rögzített. Ilyenkor osztályokat vonunk össze: egyesítjük azokat az eseményeket, melyekre a gyakoriságok kicsik. Az összevonás utáni teljes eseményrendszerre végrehajtjuk a -próbát.

6.8. Példa. Vizsgálandó, hogy az valószínűségi változó eloszlása megegyezik-e a paraméterű Poisson-eloszlással. A Poisson-eloszlás táblázata alapján az , és eseményekből álló teljes eseményrendszert érdemes alapul venni, mivel

elemű mintát véve -re, az események gyakoriságára rendre adódott. Ekkor

szinten a táblázatából 7.779 kritikus érték adódik. Így -at szinten elfogadjuk.

Most azt vizsgáljuk, hogyan dönthető el a normalitás.

6.9. Példa. eloszlása standard normális.

Jelölje a standard normális eloszlásfüggvényt. A táblázat alapján

A

osztópontokat választjuk. A fennállása esetén az egyes intervallumok valószínűségei:

Az -re végzett megfigyelés alapján az egyes intervallumokba esések gyakoriságaira az alábbiak adódtak:

A statisztika:

-at minden használatos szinten elvetjük, hisz a táblázat alapján a 0.95 szinthez 16.92, a 0.99 szinthez 21.67, sőt még az 0.995 szinthez is csupán 23.59 kritikus érték tartozik. A statisztikánk aktuális értéke még ezen legutóbbit is meghaladja.

6.3.3. 6.3.3. Becsléses illeszkedésvizsgálat

A gyakorlatban az eloszlásfüggvény alakjára van feltételezésünk, azonban az eloszlásfüggvény bizonyos paraméterei nem ismertek. Legyen

ahol az eloszlásfüggvényében a (egydimenziós) paraméterek ismeretlenek. A minta alapján becsüljük meg az ismeretlen paramétereket maximum-likelihood módszerrel. Jelölje a maximum-likelihood becslését. Vizsgáljuk a

hipotézist a korábban ismertetett eljárással. A módszerben a változás csupán annyi, hogy a -eloszlás szabadsági fokát a becsült paraméterek számával kell csökkenteni, azaz a kritikus értéket táblázatából kell kikeresni.

6.3.4. 6.3.4. Függetlenségvizsgálat

Legyen és két teljes eseményrendszer. A két teljes eseményrendszer függetlenségét vizsgáljuk:

Amennyiben a két teljes eseményrendszerhez tartozó valószínűségek ismertek, akkor tiszta illeszkedésvizsgálatra vezethető vissza a feladat:

ahol előre megadott számok. Mivel itt

egy teljes eseményrendszer és

egy adott valószínűségeloszlás, az előző rész alapján a próbastatisztika megkonstruálható. A határeloszlás esetén lesz.

Azonban sokkal realisztikusabb az a felfogás, hogy a és számok nem ismertek, így azokat a mintából kell becsülni. Hajtsuk végre a két teljes eseményrendszert tartalmazó kísérletet -szer, függetlenül. Jelölje az esemény gyakoriságát. A gyakoriságokat foglaljuk ún. kontingencia táblázatba.

 

 

 

     

 

 

A peremeken található számok:

Az események ismeretlen valószínűségét a relatív gyakorisággal becsüljük:

Így megfigyelt értéke , várt értéke ( esetén)

lesz. Így a -statisztika:

Az ismeretlen paraméterek: ; azonban a és miatt csupán darab -t és darab -t kell becsülni. Így (azaz a függetlenség) fennállása esetén a -statisztika aszimptotikusan

eloszlású.

6.10. Példa. Független-e a hajszín és a szemszín? 200 embert megfigyelve az alábbiak adódtak:

A szabadsági fok . Mivel a táblázata alapján még az -hez tartozó kritikus érték is csupán 13.82, így -at minden használatos szinten elvetjük.

Ellenőrző kérdések

  1. Mi az illeszkedésvizsgálatra vonatkozó -próba?

  2. Mi a függetlenségvizsgálatra szolgáló -próba?