C. függelék - Valószínűségszámítás és statisztika

Tartalom

Valószínűség
Várható érték
Statisztika
Pontbecslés
A központi határeloszlás-tétel
Intervallumbecslés
Hipotézisvizsgálat

Ebben a függelékben a valószínűségszámítás és statisztika azon alapvető fogalmait vezetjük be, melyeket a könyvben széleskörűen használunk.

Valószínűség

Véletlen kísérlet alatt olyan mérési folyamatot értünk, melynél a kimenetel bizonytalan. Ilyen például egy kocka feldobása, egy kártyalap kihúzása a pakliból, vagy éppen egy hálózati útválasztón (router) áthaladó forgalom típusa. Az összes lehetséges kimenetelek Ω halmaza a mintatér vagy eseménytér. A kockadobás mintatere például Ω={1,2,3,4,5,6} . Esemény alatt ezen kimenetelek egy EΩ részhalmazát értjük. Így például E={2,4,6} az az esemény, hogy a kockával párosat dobunk.

A P valószínűség az Ω mintatéren értelmezett valós értékű függvény, mely a következő tulajdonságokat teljesíti:

  1. Minden EΩ eseményre igaz, hogy 0P(E)1 .

  2. (b) P(Ω)=1 .

  3. Diszjunkt események minden E 1 , E 2 ,, E k Ω halmazára

P( i=1 k E i )= i=1 k P( E i ).

Egy E esemény P(E) valószínűsége E bekövetkezéseinek aránya egy potenciálisan végtelen hosszú kísérletsorozatban.[10]

Véletlen kísérletekben gyakran egy számunkra érdekes mennyiséget szeretnénk mérni, például az írások számát egy érme ötvenszeri feldobása esetén, vagy egy vidámparki hullámvasútra váró sorban a következő személy magasságát. Mivel ez a mért mennyiség a véletlen kísérlet kimenetelétől függ, véletlen változónak vagy valószínűségi változónak nevezzük. Egy véletlen változó felvett értékeinek halmaza lehet diszkrét vagy folytonos. Egy ún. Bernoulli típusú valószínűségi változó diszkrét, mert értékkészlete mindössze a 0 és 1 értékeket tartalmazza.

Annak a valószínűsége, hogy egy X diszkrét valószínűségi változó egy ν értéket vesz fel, megegyezik az összes olyan e kimenetelek teljes valószínűségével, melyekre X(e)=ν :

P(X=ν)=P(E={e|eΩ,X(e)=ν}). (C.1)

Egy X diszkrét valószínűségi változó fenti valószínűségi eloszlása valószínűségi tömegeloszlásként is ismert.

C.1. Példa.

Tekintsünk egy olyan véletlen kísérletet, melyben egy szabályos érmét dobunk fel négy alkalommal. Ebben a kísérletben 16 lehetséges kimenetel van: FFFF, FFFI, FFIF, FIFF, IFFF, FFII, FIFI, IFFI, FIIF, IFIF, IIFF, FIII, IFII, IIFI, IIIF és IIII, ahol F a fejet, I pedig az írást jelöli. Legyen X az a valószínűségi változó, mely azt méri, hogy a kísérlet során hányszor lett írás az eredmény. Az öt lehetséges értéke X -nek 0,1,2,3 és 4 . X valószínűségi eloszlását a következő táblázat tartalmazza:

X

0

1

2

3

4

P(X)

1/16

4/16

6/16

4/16

1/16

Például P(X=2)=6/16 , mert hat olyan kísérlet van, melyben két írás szerepel a négy dobás között.

Másrészt, ha X folytonos valószínűségi változó, akkor annak a valószínűsége, hogy X az a és b értékek között veszi fel értékeit

P(axb)= a b f(x)dx. (C.2)

Az f(x) függvényt (valószínűségi) sűrűségfüggvénynek nevezzük. Folytonos valószínűségi változó esetén nulla annak a valószínűsége, hogy X egy meghatározott x értéket vesz fel.

1. táblázat - Példák valószínűségi eloszlásokra ( Γ(n+1)=nΓ(n) és Γ(1)=1 )

Valószínűségi eloszlás

Paraméterek

Gauss

p(x)= 1 2π σ exp 1 2 (xμ) 2 σ 2

μ,σ

Binomiális

p(x)=n x p x (1p) nx

n,p

Poisson

p(x)= 1 x! θ x exp θ

θ

Exponenciális

p(x)=θ exp θx

θ

Gamma

p(x)= λ α Γ(α) x α1 exp λx

λ,α

Khi-négyzet

p(x)= 1 2 k/2 Γ(k/2) x k/21 exp x/2

k


A C.1. táblázat néhány jól ismert diszkrét és folytonos valószínűségi eloszlást tartalmaz. A valószínűségi eloszlás fogalma kiterjeszthető több valószínűségi változóra is. Ha például X és Y két valószínűségi változó, akkor p(X,Y) jelöli az együttes sűrűségfüggvényüket. A valószínűségi változók függetlenek, ha P(X,Y)=P(X)P(Y) . Két valószínűségi változó függetlensége azt jelenti, hogy az egyik valószínűségi változó értéke nincs hatással a másik értékére.

A feltételes valószínűség egy másik hasznos fogalom valószínűségi változók függőségének megértésére. Az Y valószínűségi változó X feltételre nézve vett P(Y|X) feltételes valószínűségét a

P(Y|X)= P(X,Y) P(X) (C.3)

módon definiáljuk. Ha X és Y függetlenek, akkor P(Y|X)=P(Y) . A P(Y|X) és P(X|Y) feltételes valószínűségek kifejezhetők egymással a Bayes-tétel segítségével:

P(Y|X)= P(X|Y)P(Y) P(X) . (C.4)

Ha { X 1 , X 2 ,, X k } az X valószínűségi változó egymást kölcsönösen kizáró és a teljes eseményteret lefedő kimenetelei, akkor a nevező kifejezhető a következőképpen:

P(X)= i=1 k P(X, Y i )= i=1 k P(X| Y i )P( Y i ). (C.5)

(app:total_prob) egyenletet a teljes valószínűség tételének nevezzük.

Várható érték

Egy X valószínűségi változó g függvényének E[g(X)] várható értéke a g(X) súlyozott átlaga, ahol a súlyokat X valószínűségi eloszlása (folytonos esetben sűrűségfüggvénye) adja. Ha X diszkrét, akkor a várható érték a következőképpen számolható ki:

E[g(X)]= i g( x i )P(X= x i ). (C.6)

Másrészt, ha X folytonos, akkor

E[g(X)]= g(X)f(X)dX, (C.7)

ahol f(X) az X sűrűségfüggvénye. A szakasz további részében kizárólag diszkrét valószínűségi változók várható értékével foglalkozunk. A megfelelő eredmények átvihetők folytonos esetre, ha az összegzést integrálra cseréljük.

Különböző hasznos várható értékeket kapunk g(X) megfelelő megválasztásával. Ha például g(X)=X , akkor

μ X =E[X]= i x i   P(X= x i ). (C.8)

Ez a várható érték X valószínűségi változó várható értéke vagy elméleti átlaga. Egy másik hasznos várható érték tartozik g(X)= (X μ X ) 2 -hez. Ekkor a

σ X 2 =E[ (X μ X ) 2 ]= i ( x i μ X ) 2   P(X= x i ) (C.9)

értéket X szórásnégyzetének (varianciájának) nevezzük. Ennek négyzetgyöke a szórás.

C.2. Példa.

Tekintsük a C.1. példában leírt kísérletet. Az írások átlagos száma négy dobás esetén

μ X =0×1/16+1×4/16+2×6/16+3×4/16+4×1/16=2. (C.10)

A variancia

σ X 2 = (02) 2 ×1/16+ (12) 2 ×4/16+ (22) 2 ×6/16

    + (32) 2 ×4/16+ (42) 2 ×1/16=1.

Valószínűségi változó-párokra hasznos várható érték a kovariancia, melynek definíciója

Cov(X,Y)=E[(X μ X )(Y μ Y )]. (C.11)

Megjegyezzük, hogy egyetlen X valószínűségi változóra a kovariancia megegyezik a varianciával. A várható érték általánosan rendelkezik a következő tulajdonságokkal:

  1. (a) E[a]=a , ha a konstans.

  2. (b) E[aX]=aE[X] .

  3. (c) E[aX+bY]=aE[X]+bE[Y] .

Ezeknek a tulajdonságoknak köszönhetőena (C.9) és (C.11) egyenletek átírhatók:

σ X 2 =E[ (X μ X ) 2 ]=E[ X 2 ]E [X] 2 , (C.12)

Cov(X,Y)=E[XY]E[X]E[Y]. (C.13)



[10] A fordító megjegyzése: Ez a valószínűség relatív gyakoriságon alapuló megközelítése.