• Vállalkozói szellem
    • Vállalkozók létrehozása
  • LEAN Six Sigma
    • Hat Szigma
    • Olvas
    • Eszközök
  • Innováció
    • Costa Rica újít
  • Az adatok elemzése
    • Minitab
  • Minőség
    • Vezetés
    • CQE
  • hírek
    • BBCross Jobs
    • Könyvtörténetek
  • Projektek
    • Új termék bemutatása
  • Szoftver és web
    • Adatkezelés
    • Kód
  • Iparágak
    • Étel
    • Orvosi eszközök
    • Ellátó lánc
    • Digitális átalakulás
    • Szabványosítás
  • Támogatás és GYIK
    • BBCross virtuális campus
    • e-tanulás
    • Kiképzés
    • GAGEpack
    • SQCpack GYIK
    • Change Point Analyzer GYIK
    • Prezi GYIK
    • ASQ
  • Események
    • Online
    • Házon belüli és nyilvános

Tárolja a BBCross

Oktatóanyagok, hírek, referenciaértékek és egyebek

hogyan

Facebook Live

A BBCross ™ fejlesztése a fejlesztés érdekében

A "Simpson-paradoxon" egy jól ismert jelenség, amely torzíthatja az ok-okozati összefüggéseket az adathalmazokban egy zavaró vagy kovariált jelenlétében. Ebben a cikkben néhány gyakorlati módról fogunk beszélni, hogy megvédje magát, és ne essen áldozatul ennek az alattomos hatásnak.

A memória felfrissítése érdekében a Simpson paradoxonja annak a jelenségnek nevezik, ahol a hatás iránya megfordul, ha figyelembe vesznek egy korábban figyelmen kívül hagyott változót (egy "lappangó" változót, amelyet rejtett változónak is neveznek), amely jelentősen befolyásolja a kapcsolatot.

A testmozgás tanulmányozása

Bemutatjuk a definíciót egy példával. Az Ön feladata egy tanulmány, amely összehasonlítja, hogy két (2) fogyókúrás technika - diéta és testmozgás - hogyan befolyásolja a túlsúlyos betegek fogyását. Összességében 240 beteg vesz részt a vizsgálatban, 120-at súlycsökkentő étrendre, a fennmaradó 120-ot pedig felügyelt testedzési rendre osztanak be.

A 30 nap végén megméri az egyes csoportok fogyását. Az adatok azt mutatták, hogy 70 fogyókúra és 57 sportoló fogyott jelentősen, ami 58% -ot jelent a diétás csoportban és csak 48% a testmozgási csoportban - jelentős különbség. Tehát arra a következtetésre kell jutnia, hogy a diéta jobb, mint a testmozgás?

Nem, ezért lehet ilyen bonyolult a Simpson Paradox! Ha az adatokat a résztvevők testtömeg-indexe (BMI) alapján rétegezzük, amint az alább látható, akkor egy tisztább kép rajzolódik ki:

(eredeti cikk táblázat)

BMI-csoportonként jól látható, hogy az egyes BMI-k esetén fogyókúrás betegek aránya kisebb volt a fogyókúrázók körében, mint a sportolóké. Meglepő változó ("leselkedő", rejtett) az elhízott és súlyosan elhízott betegek kiegyensúlyozatlan elosztása az étrend és a testmozgás csoportjaiban.

Amint láthatja, a számok megfordulnak a két csoport között: 40 elhízott és 80 súlyosan elhízott a Diéta csoportban, valamint 80 elhízott és 40 súlyosan elhízott a Testmozgás csoportban. Mivel úgy tűnik, hogy a súlyosan elhízott csoport aránytalanul jobban részesült az egyes kezelésekből, a testmozgásért felelős csoportot egyszerűen azért büntették meg, mert a csoportban kevésbé súlyosan elhízottak.

Simpson paradoxona a cselekvésben: A lefogyott betegek aránya magasabb volt az elhízott és súlyosan elhízott sportolók körében, de ha a két csoportot hozzáadjuk, úgy tűnik, hogy a fogyókúrázók fogynak a legtöbbet.

Két tényező játszik szerepet itt. Először is van egy figyelmen kívül hagyott zavaró változó (BMI), másodszor pedig a BMI szintek aránytalan elosztása a kísérleti csoportok között (diéta és testmozgás). Nem tudjuk az aránytalan felosztás okát, de feltételezhetjük, hogy a betegek valahogyan maguk választották ki, hogy a két csoport közül melyikhez tartoznának.

Az egyszerű diagramok és grafikonok nagyban hozzájárulhatnak az alapul szolgáló adatok megmagyarázásához. Lásd például ezt a Microsoft® Excel® alkalmazásban készült oszlopdiagramot, amely a lebontott adatokat ábrázolja; mutatja a fogyókúrázók és a sportolók arányát az egyes BMI-csoportokban.

Az alábbi grafikon mutatja a súlycsökkenéssel és anélkül szenvedő betegek arányát a különböző alcsoportok között.

Nyilvánvaló, hogy több sportoló fogyott minden egyes BMI-csoportban (vegye figyelembe a kék szintet az első két oszloppárban), de az összesített mintában az arányok megfordulni látszanak.

A hamis eredmények elkerülése érdekében mindig jó gyakorlat megvizsgálni, hogy az adatkészlet összesítésében fennálló kapcsolat fennáll-e az alhalmazokban, különösen akkor, ha egyes csoportok nem ugyanúgy vannak ábrázolva, mint mások az adatokban.

Egy másik módszer lehet a minták súlyának méretük szerinti súlyozása.

Sajnos a statisztikai elemző eszközök éppen ilyenek - a megfigyelt adatok rendszerezését és elemzését segítő eszközök.

Nem tudnak semmit mondani olyan adatokról, amelyeket nem láttak, vagy amelyek nem szerepeltek az elemzésben.

Ezért nagyon fontos egy keresztfunkcionális csapat és különösen a témában dolgozó szakértők és szakemberek bevonása a mérendő változók kezdeti tervezésébe és kiválasztásába. Az adatok összegyűjtése után az egyetlen módja ennek a buktatónak a kiküszöbölésére vizuálisan van, és egyébként az adatok jelentős részhalmazait kell megvizsgálni.

Simpson paradoxona általában nem jelent gondot egy jól megtervezett kísérlet vagy felmérés során. Azonosíthatja a lehetséges "rejtőzködő" (rejtett) változókat, és megfelelően vezérelheti őket azáltal, hogy eltávolítja őket, állandóan tartja őket az összes csoport számára, vagy bevonja őket a vizsgálatba.

A megfelelő randomizálás nagyban hozzájárul a rejtett változó hatásainak minimalizálásához is. A kovariancia elemzésében, amelyben a válaszhoz kapcsolódó lehetséges változókat (kovariátokat) (példánkban a kezdeti BMI nem volt összefüggésben a kezelésekkel, de befolyásolta a fogyást) hozzáadtuk a modellhez, és ezek szintén segítenek.

Ha azonban nincs lehetősége tanulmányának megtervezésére, akkor egy adatbázisból származó adatokat kapunk, és megkérik, hogy "találja meg, amit tudok", Simpson Paradoxonának az a tanulsága, hogy mindig az összesítés különböző szintjein nézze meg az adatokat, mint az előző példában.