10. évfolyam
Medián kvartilisek - extrém adatok esetén
Az alkalmazás nehézségi szintje, tanárként
Közepes.
Módszertani megjegyzés, tanári szerep
Ha csak annyit tudunk két adatsokaságról, hogy az átlagaik egyenlők, az kevés a két adatsokaság összehasonlításához, hiszen az adatok eloszlásáról semmit sem mondanak az átlagok.
A boxplot ábraalkalmas arra, hogy szemléltesse azt, hogy az adatok mennyire szimmetrikusan helyezkednek el az átlag körül.
Ha a doboz (box) azábra bal oldalán helyezkedik el, akkor jellemzőbbek a kisebb adatok. Ha emellett a dobozban a medián is bal oldalon helyezkedik el, akkor még inkább jellemzőbbek a kisebb adatok.
Ha a doboz (box) azábra jobb oldalán helyezkedik el, akkor jellemzőbbek a nagyobb adatok. Ha emellett a dobozban a medián is jobb oldalon helyezkedik el, akkor még inkább jellemzőbbek a nagyobb adatok.
Egy adatsokaságon belül a „kisebb”, illetve „nagyobb” megjelölés a legkisebb, illetve legnagyobb adathoz viszonyított elhelyezkedésre utal.
Felhasználói leírás
Egy faluban két gazda is foglalkozik tehenek tartásával.
Vizsgáljuk meg mindkét gazda teheneinek tejhozamait!
„A” gazda teheneinek napi átlagos tejhozama: 8, 10, 10, 12, 12, 13, 17, 22, 31 (liter).
„B” gazda teheneinek napiátlagos tejhozama: 3, 12, 12, 15, 17, 17, 18, 19, 22 (liter).
Figyeld meg a tejhozamok eloszlását!
Tanácsok az interaktív alkalmazás használatához
A csúszka „Bevitel” állása esetén:
Kiválasztható a Gazda. Hozzáadhatunk új adatot. Sorszám alapján törölhetünk adatokat vagy törölhetjük az összes adatot. A tejhozamoka táblázatokban növekvő sorrendben jelennek meg.
A csúszka „Kiértékelés” állása esetén:
Mindkét gazda esetén megjelenik a tejhozamok boxplot diagramja. Az ábrán fel vannak tüntetve a következő mutatók: minimum, alsó kvartilis, medián, felső kvartrilis, maximum, továbbá az átlag.
Feladatok
- Vizsgáld meg a tehenek átlagos tejhozamát mindkét gazda esetén!
Megoldás: Az átlagos tejhozam mindkét gazdánál 15 liter.
- Nézd meg a boxplot ábrát, és mondd meg, hogy az „A” gazda teheneinek tejhozamaira mi a jellemzőbb? A kisebb vagy a nagyobb tejhozam? (Egy adatsokaságon belül a „kisebb”, illetve „nagyobb” megjelölés a legkisebb, illetve legnagyobb adathoz viszonyított elhelyezkedésre utal.)
Megoldás: Az „A” gazda esetén a doboz és a dobozban lévő vonal (medián) a diagram bal oldalán helyezkedik el, vagyis jellemzőbbek a kisebb tejhozamú tehenek.
- Nézd meg a boxplot ábrát, és mondd meg, hogy az „B” gazda teheneinek tejhozamaira mi a jellemzőbb? A kisebb vagy a nagyobb tejhozam? (Egy adatsokaságon belül a „kisebb”, illetve „nagyobb” megjelölés a legkisebb, illetve legnagyobb adathoz viszonyított elhelyezkedésre utal.)
Megoldás:Az „B” gazda esetén a doboz és a dobozban lévő vonal (medián) a diagram jobb oldalán helyezkedik el, vagyis jellemzőbbek a nagyobb tejhozamú tehenek. Az „A” gazda teheneire jellemzőbbek a kisebb tejhozamok, azonban van egy-két sok tejet adó tehén, emiatt az átlag nagyobb, mint a medián. Az „B” gazda teheneire jellemzőbbek a nagyobb tejhozamok, azonban előfordul egy-két kevés tejet adó tehén, emiatt az átlag kisebb, mint a medián. A példából látszik, hogy az átlag érzékeny a „kiugró” adatokra. Pusztán az átlag nem ad információt az tejhozamok eloszlásáról.
- Módosítsd úgy az adatokat, hogy az A gazda teheneinek átlagos tejhozama nagyobb legyen, mint a B gazda teheneinek átlagos tejhozama!
Megoldás: Például A gazda esetén a 31-et cseréljük ki 32-re. Így az átlag nagyobb lesz. Előáll az a furcsa helyzet, hogy bár A gazda teheneire jellemzőbb a kisebb tejhozam és B gazda teheneire jellemzőbb a nagyobb tejhozam, mégis A gazda teheneinek átlagos tejhozama a nagyobb.
Ez a szélsőséges adatok előfordulásának köszönhető, nevezetesen, hogy A gazdának van kiugróan nagy tejhozamú tehene, illetve B gazdának van kiugróan kis tejhozamú tehene.