5.2. 5.2. Statisztikák

5.2.1. 5.2.1. Az empirikus közép

Legyen minta -re. Az

valószínűségi változót empirikus középnek (más szóval minta átlagnak) nevezzük.

Tegyük fel, hogy -nek létezik véges várható értéke: . Amennyiben nem ismert, úgy a minta alapján meghatározható segítségével következtethetünk -re. várható értéke és szórásnégyzete:

ahol az elméleti szórásnégyzet.

5.2.2. 5.2.2. Az empirikus szórásnégyzet

Az

mennyiséget empirikus szórásnégyzetnek nevezzük. Az empirikus szórásnégyzet alapján következtethetünk ismeretlen (elméleti) szórásnégyzetére. Ki fog derülni, hogy erre a célra alkalmasabb alábbi módosítását használni. Az

mennyiséget korrigált empirikus szórásnégyzetnek nevezzük. numerikus kiszámolására és elméleti vizsgálatára is alkalmas az alábbi ún. Steiner-formula.

5.6. Tétel. Tetszőleges esetén

Bizonyítás. A következő átalakításokat végezzük:

várható értékét a Steiner-formulába -et írva számolhatjuk ki:

Tehát a korrigált empirikus szórásnégyzet várható értéke éppen az elméleti szórásnégyzet.

5.2.3. 5.2.3. A statisztika fogalma

Legyen minta -re.

5.7. Definíció. Legyen Borel-mérhető függvény. Ekkor a valószínűségi vektorváltozót statisztikának nevezzük.

A fenti definícióban rögzített pozitív egész szám, értéke leggyakrabban 1. Az empirikus közép az egyik legegyszerűbb statisztika, ekkor a függvény:

Természetesen és is statisztikák. Az empirikus eloszlásfüggvény is statisztikának tekinthető: rögzített mellett a fenti értelemben, ha pedig függvénynek tekintjük, akkor kissé általánosabban, helyett a lépcsős függvények halmazát véve képterének.

Az empirikus közép és az empirikus szórásnégyzet az empirikus momentumok speciális esetei. A -adik empirikus momentum:

A -adik empirikus centrált momentum

5.2.4. 5.2.4. Az empirikus korrelációs együttható

Tegyük fel, hogy az és az valószínűségi változókat egyszerre meg tudjuk figyelni. Legyen

megfigyelés az kétdimenziós valószínűségi vektorváltozóra (azaz a fenti valószínűségi vektorváltozók független, -vel azonos eloszlásúak). Az

mennyiséget empirikus kovarianciának, a

mennyiséget pedig empirikus korrelációs együtthatónak nevezzük.

Az empirikus közép és az empirikus szórásnégyzet eloszlását tekintjük normális eloszlásból vett minta esetén. Legyen minta az eloszlásból. Ekkor eloszlása . Valóban, független, normális eloszlású valószínűségi változók összege normális eloszlású, míg

5.8. Tétel. Normális eloszlásból vett minta esetén és függetlenek. Ha eloszlása , akkor eloszlása és eloszlása

5.9. Következmény. Normális eloszlásból vett minta esetén

eloszlású. Ez abból adódik, hogy standard normális, pedig eloszlású, és egymástól függetlenek.

Gyakorlatok

  1. Legyen 37.2, 36.8, 37.9, 36.1, 36.7, 37.1, 36.7 egy minta. Számítsuk ki az empirikus közepet és az empirikus szórásnégyzetet.

  2. Az empirikus kovariancia kiszámításához lássuk be, hogy

  3. Írjunk programot az empirikus közép, az empirikus szórásnégyzet és az empirikus kovariancia kiszámítására.

Ellenőrző kérdések

  1. Mi az empirikus közép és empirikus szórásnégyzet?

  2. Mi lesz az empirikus közép és a korrigált empirikus szórásnégyzet eloszlása normális eloszlásból származó minta esetén?

  3. Mi a Steiner-formula?