M. kutatás

Tartalomjegyzék

Bevezetés

A vizsgálat céljából összegyűjtött adatok elemzésekor a megfelelő elemzési módszer kiválasztása elengedhetetlen a téves következtetések levonásának elkerülése érdekében. A legmegfelelőbb elemzési technikát kell kiválasztani, figyelembe véve a vizsgálat tervezésével és a számszerűsítendő adatok jellegével kapcsolatos különböző szempontokat. Az összehasonlítandó megfigyelési csoportok száma, azok jellege (attól függően, hogy független minták vagy ugyanazon egyedeken végzett ismételt megfigyelések), az adatok típusa (folytonos/kvalitatív változók) vagy valószínűség-eloszlásuk meghatározó elemeket jelent az alkalom, hogy megismerjék az alkalmazható statisztikai technikákat.

parametrikus

A kvantitatív adatok elemzésénél a gyakorlatban legismertebb és leggyakrabban alkalmazott statisztikai módszerek, például a Student-féle t-teszt vagy a variancia-elemzés olyan feltételezéseken alapulnak, amelyeket a rendelkezésre álló adatok nem mindig igazolnak. Így általában azt kell feltételeznünk, hogy az érdekes változó például egy Gauss-eloszlást követ. Ha a normalitás hiánya nyilvánvaló, vagy ha a csökkentett mintamérettel nem lehet teljes mértékben elfogadni, akkor általában az érdeklődő változó transzformációját (például a logaritmikus transzformációt) alkalmazzák eloszlásának szimmetrálásához vagy a közös igénybevétel technikáinak használatához. robusztusságukra (vagyis alacsony érzékenységükre a normalitás hiányára). Vannak más, általában nem parametrikusnak nevezett módszerek, amelyek nem igényelnek ilyen típusú hipotézist az adatok elosztásáról, könnyen megvalósíthatók, és kis mintanagysággal is kiszámíthatók. Jelen munkában a gyakorlatban a legtöbbet használt nem-parametrikus módszereket ismertetjük.

Két független minta: a Mann-Whitney U teszt és a Wilcoxon rangösszeg teszt

Sok helyzetben kívánatos tesztelni, hogy az X változó eloszlása ​​megegyezik-e két populációban, vagy az említett változó a minta két csoportjának egyikében nagyobb (vagy kevesebb) a minta adatai alapján. Érdekes lehet például összehasonlítani a két különböző étrendben szenvedő betegek súlycsökkenését, vagy a kezelésben részesülő osteoarthritisben szenvedő betegek fájdalomszintjét a placebóval szemben. A „hagyományos” statisztikai elméletben az ilyen típusú összehasonlítás elvégzéséhez a teszt két független mintának a Student-féle próbája lenne: a Mann-Whitney U teszt vagy a Wilcoxon rangösszeg teszt nem karakteres tesztek. amit ebben a helyzetben is fel lehetne használni.

Formálisabb módon tegyük fel, hogy ugyanazon X változóval (súlycsökkenés, fájdalom pontszám stb.) Két különböző populációban vannak megfigyelések n1 és n2 méretű mintákon:

1. népesség:
2. népesség:

Az eljárás intuitív módja az, hogy a kapott megfigyeléseket - a származási populációuktól függetlenül - a legalacsonyabbtól a legnagyobb értékig rendeljük, és tartományokat rendeljünk az így rendezett adatokhoz. Ily módon a kisebb értékű megfigyeléshez 1., a következő 2. rangot stb. Kapcsolatok esetén (ha két vagy több megfigyelés egybeesik értékben), mindegyik megfigyeléshez hozzárendelik azon tartományok átlagát, amelyeket hozzárendelnének, ha nem lenne egyenlő.

Ha nincs különbség a két populáció közötti megoszlásban, a tartományokat véletlenszerűen kell összekeverni a két minta között. Másrészt, ha az egyik populáció megfigyeléséhez rendelt tartományok összege sokkal nagyobb, mint a másik populáció megfigyeléseihez rendelt tartományok összege, ez az X változó eloszlásának különbségét jelezné mindkettő között.

Jelöljük az elérhető megfigyelések mindegyikéhez rendelt ranggal. Az egyik populáció rangjainak összegét kontrasztstatisztikának tekintjük a Wilcoxon rangösszeg-tesztnél:

A korábbi statisztikák valószínűség-megoszlását kis mintanagyságokra és kapcsolatok hiányában táblázatosan adtuk meg (1. táblázat). Így az 1. táblázat hasznos tudni, hogy az eredmény kétoldalú szinten szignifikáns, ha 95% -os biztonsággal és ≤15 mintamérettel dolgozunk.

Nagyobb mintaméreteknél (> 15) célszerű a normál közelítést használni, a T-ből kapva a változót:

hol és hol van a T átlagértéke és szórása, ha a nullhipotézis igaz, és a következő képletek adják meg:

Y

A kapcsolatok számának szintén csekélynek kell lennie a megfigyelések teljes számához viszonyítva. A kapcsolatok esetében a T statisztika varianciáját módosítani kell, hogy az előző kifejezés a következő legyen:

Miután megkapta z értékét, a normális eloszlás táblázataihoz kell utalni, hogy megkapja a hozzá tartozó szignifikancia értéket.

Ennek a tesztnek az illusztrálására a 2. táblázat adatait vesszük figyelembe, amelyek megfelelnek a fájdalom mérési értékeinek (0-10 skálán) két, 11 betegből álló csoportban, akik két különböző fájdalomcsillapító kezelést végeznek. Ebben az esetben n1 = n2 = 11. Az első csoport megfigyeléseihez rendelt tartományok összege T = 171, és annak átlaga

Mivel a megszerzett rangok összege meghaladja a vártat, a T = 171-126,5 = 44,5 értéket vesszük végleges statisztikának, és az 1. táblázat értékeire fogjuk hivatkozni. Kétoldalú megközelítéssel és 95% -os biztonsággal dolgozunk, a kilökődési régió megfelel a 96-nál kisebb vagy azzal egyenlő T-értékeknek, amelyek esetében az azonos fájdalomszint nullhipotézisét mindkét kezelési csoportban elutasítanánk a Wilcoxon rang összegének szignifikáns p tesztjével, a Mann-Whitney U teszttel. név. A valóságban két különböző tesztről van szó, bár lényegében egyenértékűek egymással. A Mann-Whitney U teszt kiszámításához a rangok összege helyett az értékeket kell kiszámítani:

U12: azon párok száma, amelyeknél az első populáció megfigyelése kevesebb, mint a második populáció megfigyelése, .

U21: azon párok száma, amelyeknél az első populáció megfigyelése nagyobb, mint a második populáció megfigyelése, .

Döntetlen esetén a fenti összegek mindegyikében 0,5 magasabb egységet számolnak. Az előző teszthez hasonlóan az alacsony U12 értékek különbséget jeleznek a változó magasabb értékeihez képest az első populációban, míg a magas értékek azt jelzik, hogy ezek általában magasabbak a második populáció.

A fenti paraméterek a fentiekben leírt T statisztikához kapcsolódnak az alábbi egyenlettel:

Így az U statisztikából a Wilcoxon statisztika értéke azonnal megszerezhető, és az előző módszertant alkalmazzák a kapcsolódó szignifikancia érték megszerzésére. Valójában a legtöbb statisztikai program, például az SPSS, mindkét statisztika értékét megjeleníti kimeneteiben, közös p-értékkel együtt, akár az aszimptotikus közelítésből normális eloszláson keresztül, akár a megfelelő táblázatokból számítva. a kapcsolatok lehetősége. Egy másik egyenértékű teszt, bár kevésbé ismert, a Kendall-féle S, amelyet S = U12-U21 szerint számítottak ki.

Végül azt mondva, hogy amint a „hagyományos” statisztikai megközelítés varianciaanalízise kiterjeszti a Student t tesztjét arra az esetre is, amikor több mint két csoportot kell összehasonlítani, a Kruskall-Wallis teszt a Mann- Whitney-teszt erre a helyzetre. Számításához a kapott N megfigyelést, függetlenül a származási populációtól, a legalacsonyabbtól a legnagyobb értékig sorrendbe rendezzük, és hozzárendeljük a megfelelő tartományokat. A Kruskall-Wallis teszt kontrasztstatisztikáját a következők adják meg:

ahol N az összehasonlított k csoport összes megfigyelésének számát jelöli, akkor ez az i-edik csoport megfigyelési tartományainak átlaga és az összes tartomány átlaga. Az így definiált H statisztika k-1 szabadságfokú eloszlást követ.

Két kapcsolódó minta: az előjel teszt és a Wilcoxon aláírt rangösszeg teszt

Egy másik nagyon gyakori helyzet az, amikor az X változó eloszlását párosított esetek két mintájában kívánják összehasonlítani, általában ugyanazon egyedeken, két különböző időpontban. Például érdemes összehasonlítani az ízületi fájdalom szintjét az infiltrációs kezelés előtt és után, vagy a testsúlycsökkentő program előtti és utáni súlyt. Ezekben a helyzetekben logikus dolgozni a megfigyelések különbségével a két pillanat között (súlycsökkenés, a fájdalom csökkenése stb.):

ahol itt az X változó megfigyelt értékeit jelöljük n egyednél az első pillanatban, és a megfigyelt értékeket egy későbbi pillanatban.

A folytatás egyszerű módja a pozitív különbségek r számának és a negatív különbségek s számának megszámlálása (a 0 értékeket nem számítva). A nullhipotézis szerint, hogy nincsenek különbségek, ugyanolyan valószínűséggel lesz pozitív vagy negatív különbség, így mindkét értéket a Bi (r + s, 1/2) paraméterek binomiális eloszlása ​​szerint osztjuk el. A binomiális eloszlás táblázatait felhasználva r-ből (vagy ekvivalensen s-ből) megkapjuk a pontos társított szignifikancia értéket (3. táblázat).

Példaként a 4. táblázat adatait fogjuk használni, amely bemutatja a súlycsökkentő programnak alávetett 20 alany által elért súlycsökkenést. A pozitív megfigyelések száma (azok a betegek, akik valóban lefogytak) r = 14, míg a negatív megfigyelések száma (betegek, akik híztak) s = 6. Ezeket az értékeket a Bi paraméterek binomiális eloszlásához viszonyítva (20,1/2) p = 2x0,058 = 0,116 értéket kapunk, így nem lehet arra következtetni, hogy a vizsgált betegeknél jelentős súlycsökkenés van.

Nagy mintaméretek (n ≥20) esetén a következők használhatók tesztstatisztikaként:

amely megközelítőleg követni fogja a normál normális eloszlást N (0,1).

A fenti példában:

Ha a kapott értéket az N (0,1) eloszlás valószínűségi függvényére utaljuk, akkor p = 0,075-et kapunk, ami nem eredményez olyan szignifikáns értéket, amely a binomiális közelítéssel történt.

Az előjel, amelyet az imént leírt tesztnek nevezünk, fő korlátozásként mutatja be azt a tényt, hogy nem veszi figyelembe a megfigyelések nagyságát (pozitív vagy negatív). Így előfordulhat, hogy sok pozitív különbség van, de csekély nagyságrendű (fogyókúrás, de kevés térfogatú betegek) és kevés negatív különbség van, de sokkal nagyobb jelentőségű (sok súlyt hozó betegek). Ez a fajta helyzet csökkenti annak lehetőségét, hogy jelentős különbségeket találjanak a megfigyelések között.

A Wilcoxon aláírt rangsori teszt a fenti hiányosságot veszi figyelembe. A megfigyelések a legalacsonyabbtól a legnagyobb abszolút értékig vannak rendezve, és tartományokhoz vannak rendelve (figyelmen kívül hagyva a null értékeket, és ugyanúgy járunk el, mint a rangösszeg-teszt esetében kapcsolatok esetén). A pozitív értékekhez rendelt tartományok T + összegét vagy a negatív értékekhez rendelt tartományok T-összegét használjuk kontrasztstatisztikaként. Kis n értékek esetén a T + és T- eloszlása ​​teljesen táblázatos, és felhasználható a teszt kritikus értékeinek megszerzésére (5. táblázat). Nagy minták (n ≥20) esetén a T + és T- eloszlás megközelíthető egy normál változóval. Így az átalakítás végrehajtása:

a hozzárendelt eloszlás egy normál normálé (ahol n 'a nullától eltérő megfigyelések száma).

Csakúgy, mint a független minták rangsorának tesztjénél, döntetlen esetén a statisztika varianciája változó, és az előző kifejezésben némi korrekciót kell végrehajtani. Hasonlóképpen, az 5. táblázat kritikus értékei a kapcsolatok esetére általában kissé konzervatívak, vagyis a kapcsolatok esetében a különbségek semmiféle hipotézisét általában elfogadják, amikor a valóságban el kell utasítani.

Mellékletben

Az N1 a legkisebb mintaméret. A T-t az 1. minta megfigyeléseihez rendelt tartományok összegeként kell kiszámítani. Igen, vesszük .
Az eredmény 5% -os kétoldalú szinten jelentős, ha T értéke kisebb vagy egyenlő a táblázatos értékkel.


k