12. évfolyam
A hipotézisvizsgálat során elkövethető hibák 4
Szükséges előismeret
Visszatevés nélküli mintavétel (hipergeometrikus eloszlás). Hipotézis-vizsgálat. Elsőfajú hiba. Másodfajú hiba.
Módszertani célkitűzés
A hipotézis-vizsgálat során elkövethető hibák (elsőfajú és másodfajú hibák) meghatározása.
Az alkalmazás nehézségi szintje, tanárként
Nehéz (érdemes előre megismerni a teljes anyagot)
Felhasználói leírás
Van két urna. Tudod, hogy az első urnában 50 golyó van, amelyek 20%-a piros; a második urnában 50 golyó van, amelyek 50%-a piros. Az egyik urnából valaki egyszerre kihúz 20 golyót, majd megmondja neked, hogy hány piros van a kihúzottak között. Az a feladatod, hogy a kapott információ alapján el tudd dönteni, hogy melyik urnából húzták a golyókat, az elsőből vagy a másodikból.
Legyen az a hipotézised, hogy a golyókat az első urnából húzták!
A számodra ismertté váló minta (a 20 húzás eredménye) alapján ezt a hipotézisedet elfogadhatod vagy elvetheted, azaz döntést hozhatsz a kérdésben, hogy az első vagy a második urnából származik-e a minta.
Tudod, hogy a minta alapján hozott döntésed hibás is lehet (elsőfajú vagy másodfajú hibát követhetsz el). Azt szeretnéd, hogy a hipotézisvizsgálat során elkövethető elsőfajú és másodfajú hiba a lehető legkisebb mértékben térjen el egymástól (a két valószínűség különbsége közel 0 legyen).
Tanácsok az interaktív alkalmazás használatához
- Beállítható az urnában lévő golyók száma (N) és a minta mérete (n).
- Az n értéke minimum N/10, maximum N/2 lehet.
- Az első urnában a piros golyók aránya 20%, a másodikban 50%.
- A diagramon sárgával látható az első urnából, kékkel pedig a második urnából vett minta esetén a kihúzott piros golyók számának valószínűség-eloszlása (hipergeometrikus eloszlások).
- A vízszintes tengelyen lévő fekete háromszöggel beállíthatók azok az intervallumok ([k+1; n] és [0; k]), amelyekhez tartozó valószínűségek a panelen megjelennek.
Feladatok
1. Tegyük fel, hogy elhatároztad: a hipotézisedet elfogadod, ha a kihúzott golyók között legfeljebb 5-ször fordult elő piros. Ezt követően megmondják meg neked, hogy valójában hány piros golyó volt a kihúzott 20 golyó között, és ennek alapján te meghozod a döntésedet.
a) Mekkora valószínűséggel követsz el elsőfajú hibát?
b) Mekkora valószínűséggel követsz el másodfajú hibát?
c) Mekkora az eltérés a hibák elkövetésének valószínűsége között?
a) 0,1399 Magyarázat: Elsőfajú hibát akkor követhetünk el ebben az esetben, ha az első urnából történt a húzás, de 5-nél többször húztak piros golyót (ennek valószínűsége 0,1399) Mi a kiinduló elhatározásunk miatt a minta alapján elvetjük a hipotézisünket, és azt fogjuk mondani, hogy a második urnából történtek a húzások. Ekkor tehát olyan hibás döntést hoztunk, amelynek a valószínűsége 0,1399
b) 0,0043
Magyarázat: Másodfajú hibát akkor követhetünk el ebben az esetben, ha a második urnából történt a húzás, de legfeljebb 5 piros golyót húztak (ennek a valószínűsége 0,0043). Mi a kiinduló elhatározásunk miatt a minta alapján elfogadjuk a hipotézisünket, és azt fogjuk mondani, hogy az első urnából húzták a 20 golyót. Ekkor tehát olyan hibás döntést hoztunk, amelynek a valószínűsége 0,0043
c) 0,1399-0,0043 = 0,1356
2. Tegyük fel, hogy elhatároztad: a hipotézisedet elfogadod, ha a kihúzott golyók között legfeljebb 6-szor fordult elő a piros. Ezt követően megmondják neked, hogy valójában hány piros golyó volt a kihúzott 20 golyó között, és ennek alapján te meghozod a döntésedet.
a) Mekkora valószínűséggel követsz el elsőfajú hibát?
b) Mekkora valószínűséggel követsz el másodfajú hibát?
c) Mekkora az eltérés a hibák elkövetésének valószínűsége között?
a) 0,0365
Magyarázat: Elsőfajú hibát akkor követhetünk el ebben az esetben, ha az első urnából történt a húzás, de 6-nál többször húztak piros golyót (ennek valószínűsége 0,0365). Mi a kiinduló elhatározásunk miatt a minta alapján elvetjük a hipotézisünket és azt fogjuk mondani, hogy a második urnából történtek a húzások. Ekkor tehát olyan hibás döntést hoztunk, amelynek a valószínűsége 0,0365.
b) 0,021
Magyarázat: Másodfajú hibát akkor követhetünk el ebben az esetben, ha a második urnából történt a húzás, de legfeljebb 6 piros golyót húztak (ennek a valószínűsége 0,021). Mi a kiinduló elhatározásunk miatt a minta alapján elfogadjuk a hipotézisünket, és azt fogjuk mondani, hogy az első urnából húzták a 20 golyót. Ekkor tehát olyan hibás döntést hoztunk, amelynek a valószínűsége 0,021
c) 0,0365 – 0,021 = 0,0155
3. Tegyük fel, hogy elhatároztad: a hipotézisedet elfogadod, ha a kihúzott golyók között legfeljebb 7-szer fordult elő a piros. Ezt követően megmondják neked, hogy valójában hány piros golyó volt a kihúzott 20 golyó között, és ennek alapján te meghozod a döntésedet. a) Mekkora valószínűséggel követsz el elsőfajú hibát? b) Mekkora valószínűséggel követsz el másodfajú hibát? c) Mekkora az eltérés a hibák elkövetésének valószínűsége között?
a) 0,0058
b) 0,0741
c) 0,0741 – 0,0058 = 0,0683
Az 1-3. feladatok alapján elmondható: az adott kezdő feltételek esetén akkor lesz a kétfajta hiba valószínűségének a különbsége a legkisebb, ha a hipotézisünk elfogadásának feltételeként azt szabjuk meg, hogy a 20 golyó között legfeljebb 6 piros golyó legyen
4. Változtasd meg a minta elemszámát (a piros golyók aránya az első, illetve második urnában változatlanul 20%, illetve 50% marad)! a) Az 1-3. feladatokhoz hasonlóan fogalmazz meg elfogadási feltételeket arra a hipotézisre, hogy a minta az első urnából származik. b) Ezután állapítsd meg az elsőfajú és a másodfajú hiba elkövetésének valószínűségét és a két valószínűség különbségét is! c) Keresd meg mindegyik esetben azt az elfogadási feltételt, amely esetén a kétféle hiba valószínűségének különbsége a lehető legkisebb!
5. Állítsd az urnákban lévő golyók számát 500-ra! A visszatevés nélküli minta méretét ekkor 50-től 250-ig változtathatod. a) Vizsgálj meg több esetet és fogalmazd meg a tapasztalataidat! b) Melyik esetekben tudsz „szinte biztos” döntést hozni a hipotézisedről és miért?