11. évfolyam
Hipotézisvizsgálat 4. – Binomiális eloszlás
Szükséges előismeret
Binomiális eloszlás. Szignifikanciaszint.
Módszertani célkitűzés
A hipotézis vizsgálat gondolkodásmódjának kialakítása, a szignifikancia fogalmának gyakorlása. A hipotézisvizsgálat alapjainak előkészítése, mint a binomiális eloszlás egy fontos alkalmazása.
Az alkalmazás nehézségi szintje, tanárként
Nehéz (érdemes előre megismerni a teljes anyagot)
Felhasználói leírás
Egy gyöngykészletek gyártásával foglalkozó cég gyáregységében kis műanyag gyöngyöket készítenek futószalagon. A gyártósorról lekerülő gyöngyök át vannak fúrva. Selejtes a gyöngy, ha nincs rajta furat.
A cégvezetés a minőségellenőrzésről Utasítást adott ki. Ebben leírják, hogy minden nap, a nap végén ellenőrizni kell az aznap gyártott gyöngyöket (több tízezer darabot). Ha a selejtarány több, mint 5%, akkor a gyártást le kell állítani és a gyártósort meg kell javítani.
Az Utasítás leírja, hogy az összes gyöngyszem megvizsgálására nincs lehetőség, ezért a minőség-ellenőrzés visszatevéses mintavétellel történik: meg kell vizsgálni 1000 gyöngyszemet, és a mintában talált selejtes gyöngyök száma alapján kell dönteni a termelés folytatásáról vagy felfüggesztéséről. Az Utasítás szerint csak akkor kell leállítani a termelést, ha a selejtes gyöngyök száma elér egy bizonyos határszámot. Ezt a határszámot az Utasításban -val jelölik, ennek értékét mindig egy külön Rendeletben határozzák meg, a cégpolitikával összhangban.
A cégvezetés természetesen nem szeretné feleslegesen felfüggeszteni a gyártást, mert az nagy költséggel járna. Ezért először is úgy döntenek, hogy a Rendeletben azt feltételezik, hogy az egy nap alatt legyártott összes gyöngy között a megengedett legnagyobb, vagyis 5% a selejtesek aránya. Tudják azt is, hogy a véletlen választás miatt az 1000 darabos mintában lehet 5%-nál kevesebb és több is a selejtesek száma.
Vajon hány selejtes gyöngy esetén lehet kijelenteni, hogy nem tartható az a feltételezés, hogy csak 5% az összes gyöngy között a selejtesek aránya?
Erre igen egyszerű választ találtak: akkor nem tartható a feltételezésük, ha a minta eredménye egy nagyon kis valószínűségű esemény bekövetkezését jelenti.
Például, ha bekövetkezik a „legalább 95 selejtes van az 1000 kiválasztott gyöngy között” esemény (tehát 95 vagy még több selejtes van a gyöngyök között), akkor biztosan nem tartható az eredeti feltételezés. Ez egyben azt is jelenti, hogy ha ekkor a mintavétel eredménye miatt leállítják a termelést, akkor rendkívül kicsi annak a valószínűsége, hogy a leállítás felesleges.
A cégvezetés szerint jó lenne, ha a felesleges leállás valószínűsége nagyon kicsi, mondjuk 0,01 lenne.
A kérdés tehát az, hogy mennyi legyen a Rendeletben előírt értéke, ha azt akarják, hogy 0,01 legyen annak az eseménynek a valószínűsége, hogy „a megvizsgált 1000 gyöngyszem között legalább darab selejtes gyöngy van”.
- A visszatevéses mintavétel miatt binomiális eloszlással kell dolgoznunk. Határozd meg az eloszlás paramétereit, ha a feltételezett selejtarány 5%! Hány elemű a minta (), és egy gyöngyszem milyen valószínűséggel selejtes ()?
Az Alkalmazás segítségével lépésről lépésre megvizsgáljuk, hogy ha a selejtarány még éppen megengedett, azaz pontosan 5%, akkor az 1000 darabos mintában hány selejtes gyöngy esetén fogadható el az a kijelentés, hogy jó a gép és hány selejtes termék esetén fogadható el az, hogy nem jó a gép.
EMBED
Kérdések, megjegyzések, feladatok
AJÁNLOTT IRODALOM, FORRÁS, KERESŐ SZAVAK:
binomiális eloszlás, hipotézisvizsgálat
- FELADAT
Ha az összes legyártott gyöngyszemnek az 5%-a selejtes, akkor az 1000 elemű mintában várhatóan hány lesz selejtes?
1000*0,05=50 - FELADAT
Ha a mintában a selejtes termékek száma 50 körüli, akkor feltételeznéd-e, hogy a gép jó? Miért?
Igen. Ha „nem sokkal nagyobb” 50-nél, akkor az lehet a „véletlen miatt” is - FELADAT
A gépet akkor tekinthetjük rossznak, ha a mintában a selejtes termékek száma „jóval több”, mint 50 darab.
Mit gondolsz, jogos ez a feltételezés? Miért?
Jogos. Azt feltételeztük, hogy 5% a selejtarány. Ezért nem lehet nagy annak a valószínűsége, hogy 50-nél „jóval több” selejtes gyöngy legyen a mintában. -
Jó lenne pontosabban tudni, hogy 50-nél mennyivel több selejtes gyöngy esetén kell a gépet rossznak tekintenünk.
Az a célunk, hogy kicsi legyen a rossz döntésünk valószínűsége (legfeljebb 0,01), másként fogalmazva kicsi legyen annak a valószínűsége, hogy a minta alapján leállítjuk a termelést, holott a valóságban jó a gép.
MÓDSZERTANI MEGJEGYZÉSEK, TANÁRI SZEREP
Meg kell tehát határozni a h legkisebb értékét. - FELADAT
- Határozd meg mennyi annak az eseménynek a valószínűsége, hogy „a mintában legalább 50 selejtes gyöngyszem lesz”?
- Mennyi annak a valószínűsége, hogy 50-nél kevesebblesz a selejtes gyöngyök száma?
- 0,52016
Tehát, ha a selejtarány a valóságban 5% (azaz a gép még éppen jónak tekinthető), akkor 0,52016 a valószínűsége annak az eseménynek, hogy „az 1000 megvizsgált gyöngyszem közül legalább 50 selejtes lesz”. - 1-0,52016=0,47984
- FELADAT
- Határozd meg mennyi a valószínűsége annak az eseménynek, hogy „a mintában legalább 55 selejtes gyöngyszem lesz”?
- Mennyi annak a valószínűsége, hogy 55-nél kevesebb lesz a selejtes gyöngyök száma?
- 0,25288
- 0,74712
- FELADAT
- Mennyi annak a valószínűsége, hogy a mintában legalább 60 selejtes gyöngyszem lesz?
- Mennyi annak a valószínűsége, hogy 60-nál kevesebb lesz a selejtes gyöngyök száma?
- 0,08673
- 0,91327
- FELADAT
- Mennyi annak a valószínűsége, hogy a mintában legalább 65 selejtes gyöngyszem lesz?
- Mennyi annak a valószínűsége, hogy 65-nél kevesebb lesz a selejtes gyöngyök száma?
- 0,02075
- 0,97925
- FELADAT
Ha a mintában 50 selejtes gyöngy van, akkor érdemes-e leállítani a termelést? Miért?
Nem érdemes. Ha azt tételeztük fel, hogy a gyártósor még éppen jó (a gyártott gyöngyök 5%-a selejt), akkor 0,52016 a valószínűsége annak, hogy az1000 darabos minta legalább 50 selejtes gyöngyöt tartalmaz, így egy 0,52016 valószínűséggel bekövetkező esemény miatt állítanánk le a gépet.
Ez a valószínűség túl nagy, tehát ha a mintában 50 selejtes gyöngyszem van, akkor nem érdemes leállítani a termelést.
Másképpen megfogalmazva: az 50 selejtes gyöngyszem mégnem meggyőző ahhoz, hogy a gépet rossznak tekintsük. - FELADAT
Ha a mintában 55 selejtes gyöngy van, akkor érdemes-e leállítani a termelést? Miért?
Nem érdemes. Ha azt tételeztük fel, hogy a gyártósor még éppen jó (a gyártott gyöngyök 5%-a selejt), akkor 0,2588 a valószínűsége annak, hogy az 1000 darabos mintában legalább 55 selejtes gyöngy lesz, így egy 0,2588 valószínűséggel bekövetkező esemény miatt állítanánk le a gépet.
Ez a valószínűség túl nagy, tehát a mintában tapasztalt 55 selejtes gyöngyszem esetén még nem érdemes leállítani a termelést.
Másképpen megfogalmazva: az 55 selejtes gyöngyszem mégnem meggyőző ahhoz, hogy a gépet rossznak tekintsük. - FELADAT
Ha a mintában 60 selejtes gyöngy van, akkor le kell-e állítani a termelést? Miért?
Nem. Ha a mintában 60 selejtes gyöngyszem van és emiatt leállítjuk a termelést, akkor 0,08673 valószínűséggel feleslegesen állítottuk le a gépet.
A döntéshozó azonban csak (legfeljebb) 0,01 valószínűséget szeretne. - FELADAT
Ha a mintában 65 selejtes gyöngy van, akkor le kell-e állítani a termelést? Miért?
Nem. Ha a mintában 65 selejtes gyöngyszem van és emiatt leállítjuk a termelést, akkor 0,02075 valószínűséggel feleslegesen állítottuk le a gépet.
A döntéshozó azonban csak (legfeljebb) 0,01 valószínűséget szeretne. - FELADAT
A számegyenesen lévő fekete háromszöget állítsd be úgy, hogy a valószínűség legfeljebb 0,01 legyen!- Mennyi selejtes gyöngyszem esetén állítanád le a termelést (mennyi a h értéke)?
- Mennyi lehet a mintában a selejtesek száma, hogy ne kelljen leállítani a termelést?
A háromszöget a 68-ra kell állítani.- Ha a mintában legalább 68 selejtes van, akkor le kell állítani a termelést (vagyis h=68),
- ha pedig legfeljebb 67 selejtes van, akkor nem kell leállítani a termelést a minta alapján.
- FELADAT
A 12. kérdésben szereplő 0,01-et, vagyis 1%-ot szignifikanciaszintnek nevezzük. Ez azt mutatja, hogy mennyi annak a valószínűsége, hogy a gépet a minta alapján leállítjuk, holott a valóságban nem kellene.
Hogyan változik a megoldás, ha 0,05-ra módosítjuk a 0,01 valószínűséget (vagyis a szignifikanciaszintet)?
Ha a mintában legalább 63 selejtes gyöngyszem van, akkor le kell állítani a termelést, ha pedig legfeljebb 62 selejtes van, akkor nem kell leállítani a termelést. - FELADAT
- A számegyenesen lévő fekete háromszög beállításával vizsgáld meg, hogy más intervallumokba mekkora valószínűséggel esik a selejtes gyöngyszemek száma a mintában!
- Vizsgáld meg, hogy mekkora határszám () tartozik 7, 8, 9 vagy 10%-os szignifikanciaszinthez!
Amikor a szignifikanciaszint 1% volt, akkor kerestük azt a (felülről korlátos) intervallumot, amelybe a selejtes gyöngyszemek száma legalább 99%-os valószínűséggel beleesik (így nem kell leállítani a gépet) és legfeljebb 1%-os valószínűséggel nem (azaz le kell állítani a gépet). Vagyis, ha a mintában a selejtes termékek száma 67-nél nagyobb (legalább 68), akkor már jelentős (szignifikáns) az eltérés a várhatóhoz (50 darabhoz) képest és nem fogadjuk el, hogy jó a gép.
- leállítjuk a termelést, holott a gép jó;
- nem állítjuk le a termelést, holott a gép rossz.
Ezt a gyakorlatban mindig át kell gondolni, hogy melyik hibát szeretnék kisebb valószínűséggel elkövetni és annak függvényében kell a szignifikanciaszintet megválasztani.
A gyakorlatban a szignifikanciaszint 1% és 10% közé szokott esni.