Statisztika – Táblázat és diagramkészítés

A statisztika mindenhol jelen van: féléves jegyeid átlaga, TikTok felhasználók számának változása vagy éppen a közvéleménykutatások eredményeinek közlésekor. A statisztika, mint a matematika egyik területe, (nagy) adathalmazok feldolgozásával, jellemzésével-elemzésével és ábrázolásával foglalkozik, sőt segít a döntéshozatalban is.

Tegyük fel azt az esetet, hogy 1000 fő ad választ egy közvéleménykutatást végző cég kérdéseire. Tegyük fel, hogy az eredményeket úgy közlik, hogy minden válaszadó minden kérdésére adott válaszát egyesével felsorolják, 20-30 oldalon keresztül… Na ne már, ennek így semmi értelme nem lenne! No pont itt jön a képbe a statisztika.

Mivel foglalkozik a statisztika?

1. Adatgyűjtés

A statisztika magában foglalja az adatgyűjtést is – ennek megannyi módja van: utcai megkérdezés, kérdőíves megkérdezés vagy éppen megfigyelés (pl. baglyok száma), esetleg kísérletezés (pl. dobókockával dobás). Erről a középiskolában aránylag kevés szó esik, az egyetemi oktatás során némileg több – melyik kutatási módszernek mi az előnye-hátránya, mikor melyiket érdemes bevetni…

2. Adatfeldolgozás és elemzés

Ha megvannak a szükséges adatok, akkor ezeket megtisztítjuk a hibás adatoktól (pl. egy válaszadó 150 évesnek jelölte magát vagy a táblázatban egy hetes dobást rögzítettünk (tévesen), amikor a 6 oldalú dobókockával) és elkezdhetjük a feldolgozást: az adatokat táblázatba rendezzük, készítünk különböző diagramokat, elemzéseket folytatunk le, illetve kiszámoljuk az adott szituációban alkalmas mutatókat.

3. Adatok prezentálása

Ha megtörtént a feldolgozás és az elemzés, akkor itt az ideje, hogy bemutassuk a kapott eredményeket a célközönségnek, mely lehet egy cég vezetője, egy tudományos magazin vagy akár egy tanárunk. Itt összegezzük a kapott eredményeket, levonjuk a megfelelő következtetéseket és ha valóban helyes volt az adatgyűjtés, akkor döntést is hozhatunk ezek alapján, például, hogy folytassuk-e a vizsgált egy adott ízesítésű üdítőital gyártását vagy sem.

Hogyan történik az adatok feldolgozása?

Táblázatkészítés

Ha kevés válaszlehetőséget tartalmazó kérdést tettünk fel, akkor azokat könnyen táblázatos formába önthetjük: az első oszlopba felvesszük a kategóriák neveit, a másodikba pedig, hogy hányan jelölték az adott válaszopciót, például így:

Ha sok különböző válaszlehetőséget tartalmazó kérdést tettünk fel, akkor azokat célszerű osztályba sorolni és úgy táblázatot készíteni. Az osztályba sorolás azt jelenti, hogy kialakítunk átfedésmentes, de az összes válaszlehetőséget lefedő kategóriákat és besoroljuk az elemeket. Például, ha mindenki egyesével beírta az életkorát és van 18-70 év között mindenféle érték, akkor csoportosíthatjuk így:

Két fontos fogalommal is meg kell ismerkednünk:

  • Gyakoriság: egy csoportba hány elem tartozik.
  • Relatív gyakoriság: az összes elem hány %-a tartozik adott csoporthoz. Számolása úgy történik, hogy az adott csoport gyakoriságát osztjuk a teljes elemszámmal (összesen).

Diagramkészítés

Kördiagram

  • Ekkor használd: Olyankor szokás használni, amikor az egyes csoportok egészhez viszonyított arányát akarjuk kifejezni, például az iskolai végzettség alapján.
  • Így készítsd el: Meg kell határozni minden csoport relatív gyakoriságát, majd 360 fokkal beszorozni: ekkor megkapjuk a középponti szögek nagyságát. Ezeket a szögeket elkezdjük bejelölni egy kördiagram belsejénél. Ha például 200°, 80°, 60° és 20° a négy csoport középponti szöge, akkor bejelölünk egy 200 fokost, utána 280 fokhoz is húzunk egy jelölést (200+80), majd 340 fokhoz (200+80+60), végül 360 fokhoz (200+80+60+20).
  • Mikor ne használd: Ha több, mint 6 csoportod van, vagy ha a csoportok relatív nagyságai hasonlóak. Ember legyen a talpán, aki egy 85°, 95°, 92° és 88° középponti szögű kördiagram cikkei között lát bármi különbséget.
  • Példa: A lenti kördiagram megmutatja, hogy a válaszadók mely ízeket kedvelik jobban. Látszik, hogy a kedvenc az az alma, ezt követi a körte, a szőlő és a többitől jelentősen lemaradva a szilva.
Kördiagram

Oszlopdiagram

  • Ekkor használd: Olyankor szokás használni, amikor az adatok időbeli változását vagy egymáshoz való viszonyát akarjuk kifejezni, például hogy 2009 és 2024 között hogyan alakultak a magyar munkavállalók átlagfizetései.
  • Így készítsd el: Készíteni kell egy derékszögű koordinátarendszert, aminek az X tengelyére a kategóriák neveit kell felvinni (például az évek), míg az Y tengelyére az egyes kategóriák értékeit (például az adott év átlagfizetése). Minden kategórianévhez egy oszlopot szerkesztünk, melynek magasságát az adott kategória értéke adja.
  • Példa: A lenti oszlopdiagram megmutatja, hogy 2009 és 2024 között évente mennyi volt a magyar munkavállalók bruttó havi átlagkeresete (forrás: ksh.hu). Látszik, hogy 2009 és 2016 között nem volt túl nagy növekedés, ám 2017-től kezdődően ez felgyorsult. Azt ne felejtsük el, hogy a vásárlóerőről ez a diagram önmagában SEMMIT nem mond el: ha a bérek a kétszeresükre nőttek, de közben az árak duplázódtak, akkor a bérek vásárlóértéke nem változott semmit (tehát a pénzünkért ugyanannyi terméket tudunk vásárolni, illetve szolgáltatást igénybe venni).
Oszlopdiagram

Sodrófa (box-plot) diagram

  • Ekkor használd: Olyankor szokás használni, amikor az adatokat már statisztikai mutatókkal is jellemeztük és ezeket akarjuk egy erre alkalmas diagramon szemléltetni.
  • Így készítsd el: Először ki kell számolni az alábbiakat: medián, alsó kvartilis, felső kvartilis. Ezt követően készítünk egy számegyenest, bejelöljük a legkisebb-legnagyobb értékeket és az előző mondatban említett mutatókat. Készítünk egy téglalapot úgy, hogy az elejét és végét az alsó és felső kvartilis értéke adja (a téglalap magassága nem számít). A dobozba a medián értékéhez húzunk egy függőleges vonalat. A doboz jobb és bal szélére egy-egy antennát húzunk, mely bal oldalt a minimum, míg jobb oldalt a maximum értékéig nyúlik ki. A kvartilishez szükséges adatok kiszámolásával egy másik leckében foglalkozunk (ezt IDE kattintva éred el).
  • Példa: A lenti box-plot diagram megmutatja, hogy a válaszadók naponta hány deciliter ivóvizet fogyasztanak el. Látható például, hogy a legkevesebb 8 dl (bal oldali antenna vége), míg a legtöbb 30 dl volt (jobb oldali antenna vége). A válaszadók fele 18,5 deciliternél kevesebbett, fele ettől többet fogyaszt naponta (medián, a doboz közepén lévő függőleges vonal). A válaszadók negyede 14 dl-nél kevesebbet (alsó kvartilis (Q1), doboz bal széle), míg negyede 25 dl-nél többet (felső kvartilis (Q3), doboz jobb széle) ivott. Ez a diagram nem mutatja meg, hogy hány alanya volt a megkérdezésnek – ugyanígy nézne ki (azonos mutatóbeli értékek alapján) 10 és 1000 főnél is.
Sodrófa (box-plot) diagram

A statisztikai táblázat és diagram témakörhöz kapcsolódó feladat

Egy kérdőív kitöltőitől megkérdezték legmagasabb iskolai végzettségüket. A kapott eredményeket az alábbi táblázat foglalja össze, melyet egy kördiagrammal is szeretnénk szemléltetni. Határozd meg a középfokú végzettséggel rendelkezőkhöz tartozó körcikk középponti szögének nagyságát!

A középponti szögek nagyságaihoz először meg kell határozni az adott csoport relatív gyakoriságát, majd 360 fokkal beszorozni. A relatív gyakoriságot úgy kapjuk meg, ha az adott csoport elemszámát elosztjuk a teljes elemszámmal, itt a középfokú végzettséggel rendelkezők vizsgáljuk, de mivel a feladat nem említi, hogy érettségisek vagy sem, ezért mindkettőt belevesszük:

  • gyakoriság: 35 + 40 = 75
  • relatív gyakoriság: 75/100 = 0,75
  • középponti szög: 360°*0,75 =270°

Válasz: A keresett középponti szög 270°.

Megosztás:

Hasonló tartalmak

Függvények, sorozatok

Függvénytranszformációk

Ha megfigyeljük, hogy évről évre hogyan alakulnak a fizetések vagy, hogy az ingatlanok alapterületei hogyan befolyásolják az árakat, akkor valójában végig a függvények témakörben vagyunk.

Elolvasom