A statisztikai adatgyűjtés során rengeteg féle információt tudhatunk meg a vizsgált objektumokkal kapcsolatban – legyen az egy élőlény vagy egy tárgy. Egy kutya esetében például annak bundájának színét, testsúlyát, testhőmérsékletét vagy éppen azt, hogy egy kutya-futóversenyen hanyaddiként végzett. Az, hogy az adatokkal milyen matematikai műveleteket végezhetünk, illetve milyen statisztikai elemzéseket hajthatunk végre attól függ, hogy milyen mérési szintűek azok.
Négy féle mérési szintet különböztethetünk meg:
- Névleges (nominális) skála
- Sorrendi (ordinális) skála
- Különbségi (intervallum) skála
- Arányskála
A különböző szintek hierarchikusan épülnek fel, a legalacsonyabb mérési szint a névleges skála. Fontos tudni, hogy a magasabb mérési szintek mindig rendelkeznek az alacsonyabb szintek mérési skáláinak összes tulajdonságával, ezek egészülnek ki újabbakkal.
Az egyes mérési szintek esetén bemutatom, hogy az adott szinten milyen matematikai-statisztikai műveletek és elemzési módszerek végezhetőek el, hogyan lehet felismerni őket, valamint néhány példát is hozok. Lássunk hozzá:
Névleges (nominális) skála – a legalacsonyabb mérési szint
Cél: a vizsgált elemek megkülönböztetése valamilyen ismérv szerint.
Matematikai-statisztikai műveletek és elemzési módszerek: gyakoriság, relatív gyakoriság, módusz, függetlenségvizsgálat (asszociációs kapcsolatvizsgálat)
Felismerés: az ilyen mérési szintű adatokra jellemző, hogy csak az adható meg, hogy az adott egyed egyik vagy másik kategóriába sorolható, de sorrendet nem tudunk felállítani az egyedek között, azaz nem mondhatjuk, hogy egyik jobb, nagyobb vagy „szebb”, mint a másik.
Néhány példa: szemszín, egy egyetemista egyeteme vagy éppen alapszakja, de vannak olyan esetek is, amikor a névleges mérési szintű adatok számoknak vannak „álcázva”, ilyen az irányítószám is – ezek csak kódként funkcionálnak, de a mögöttük lévő városok (pusztán neveik alapján) nem állíthatóak sorrendbe, így az irányítószám is csak a megkülönböztetést szolgálja.
Sorrendi (ordinális) skála
Cél: a vizsgált elemek sorrendbe állítása (a megkülönböztetés mellett) valamilyen ismérv szerint.
Matematikai-statisztikai műveletek és elemzési módszerek: a névleges mérési szint műveletei + kumulált gyakoriság, kumulált relatív gyakoriság, medián, kvantilisek (osztópontok), rangkorreláció
Felismerés: az egyedeket most már nem csak megkülönböztetni tudjuk, de sorrendet is fel tudunk állítani közöttük valamilyen ismérv szerint, azaz mondhatjuk, hogy egyik jobb, nagyobb, „szebb” vagy éppen hatékonyabb, mint a másik. Azt azonban nem állapítható meg ezen a szinten, hogy mennyivel jobb/rosszabb.
Néhány példa: versenyen elért helyezések, skálás értékelések (mennyire jellemző rád egy 1-5, 1-7, 1-10-es skálán jellegű kérdések), legmagasabb iskolai végzettség, termékek energiahatékonysági kategóriákba való besorolása
Intervallum (különbségi) skála
Cél: a vizsgált elemek különbségeinek megadása (a megkülönböztetés és a sorbarendezés mellett) valamilyen ismérv szerint.
Matematikai-statisztikai műveletek és elemzési módszerek: a névleges és sorrendi mérési szint műveletei + kivonás, átlag (kivéve mértani átlag), szórás (kivéve relatív szórás), varianciaanalízis (vegyeskapcsolat), korreláció és regresszióvizsgálat.
Felismerés: az egyedeket most már nem csak megkülönböztetni és sorbarendezni tudjuk, de ezen a szinten azt is meg tudjuk mondani, hogy mennyivel jobb, több. Azt azonban nem mondhatjuk még (hiába mondjuk a hétköznapokban gyakran), hogy az egyik hányszor jobb/több a másiknál. Nincs rögzített nullpont, ami az adott tulajdonság hiányát jelentené.
Néhány példa: hőmérséklet, tengerszint feletti magasság, intelligencia
Arányskála
Cél: a vizsgált elemek arányainak megadása (a megkülönböztetés, sorbarendezés és különbségtétel mellett) valamilyen ismérv szerint.
Matematikai-statisztikai műveletek és elemzési módszerek: a névleges, sorrendi és különbségi mérési szint műveletei + arányképzés (osztás), mértani átlag és relatív szórás – röviden: minden is 🙂
Felismerés: az egyedeket most már nem csak megkülönböztetni, sorbarendezni tudjuk, valamint a különbségüket megadni, hanem azt, hogy az egyik hányszor jobb/több a másiknál. Van rögzített nullpont, ami az adott tulajdonság hiányát jelenti.
Néhány példa: testmagasság, testsúly, egyetemi felvételi pontszám, fizetés
Fontos megjegyezni: a mérési skála szintje adja meg, hogy milyen statisztikai elemzési módszereket alkalmazhatsz. Így ha kérdőívet készítesz, például szakdolgozathoz, ezt mindig tartsd észben: nem mindegy, hogy az életkor esetében elegendő-e neked csak néhány életkori kategóriába sorolt válasz (pl. 18 év alatti, 18-25 év közötti stb.) vagy a konkrét életkorra vagy kíváncsi (begépelve). Utóbbivel lehet korrelációt-regressziót számolni, előbbivel nem.