Viac pôrodov na Valentína a menej cez Halloween

Podľa tohtoročnej štúdie v PlosOne sú pisatelia vedeckých blogov muži (check), doktorandi (check) v nejakom z oborov sociálnych vied (check) a majú Twitter (nemám). Z tohoto dôvodu mi pripadajú zvláštne rôzne blogy štatistikov (niektoré nájdeš na lište vpravo). Tieto sú v mnohých prípadoch vedené profesormi. Priznám sa, že nepoznám výskumný blog jediného profesora psychológie. Zároveň to však je super príležitosť pre nás pešiakov vedy (gather data, analyze, publish, repeat) vidieť čím sa špecialisti na nástroje zaoberajú.

No a čím sa zaoberajú? Väčšinou nadávajú na žurnalistov, ako si zasa v nejakom článku poplietli súvislosť a kauzalitu, alebo ako v nejakom grafe nezačína ypsilonová os na nule. Často takisto hrešia vedcov, lebo nepoužívajú správne metódy a ešte aj tie nesprávne používajú nesprávne. No a zvyšok času sa hádajú medzi sebou – väčšinou v rámci zákopových vojen medzi bayesiánmi a frekventistami.

Minule rozoberal štatistik Andrew Gelman štúdiu od autorov Levy, Chung a Slade (2011). Títo došli k prekvapivému zisteniu, že pôrodnosť stúpa/klesá počas dvoch sviatkov a to na Valentína a na Helloween. Počas Valentína je o 3.6% pôrodov viac (12.1% cisársky rez) ako počas okolitých 14 dní. Na Halloweena je o pôrodov o 5.3% menej (-16.9% cisársky rez) ako počas okolitých 14 dní. Autori uzavreli, že kultúrne a psychologické faktory do určitej miery môžu ovplyvniť moment pôrodu. Kedže dáta (dátumy narodenia obyvateľov USA) sú v tomto prípade verejne dostupné, objavilo sa viacej zaujímavých analýz. Tieto sú myslím poučné a preto by som ich tu rád zhrnul.

V prvom rade sa pozrime na pôvodné analýzy:

Autori použili lineárny regresný model (ancova) pričom kontrolovali vplyv dňa v týždni. Dáta sú z rokov 1996-2006 v USA. Ohviezdičkované dni boli signifikantne odlišné od ostatných.

Nedostatkom tejto analýzy je, že ignoruje dáta ostatných dní. Aké extrémne sú odchýlky pre Valentín a Halloween v porovnaní s ostatnými sviatkami a ostatnými náhodnými odchylkami? Chris Mulligan zohnal dáta od pre USA 1969-1988:

Graf zobrazuje celkový počet pôrodov pre každý deň. Z grafu vidieť, že počas viacerých sviatkov pôrodnosť klesá. Nie u všetkých sviatkov je to vidieť. Napríklad thanksgiving je druhý pondelok v októbri a v grafe ho moc nevidieť keďže sa rozdelil v priebehu rokov na viaceré dni. Valentín a Halloween nie sú až tak výrazné. Zaujímavé  je, že pôrodnosť na Valentína na rozdiel od iných sviatkov stúpa. Nakoniec vidieť aj sezónny trend a síce počet pôrodov je najvyšší koncom leta a začiatkom jesene. Zrejme majú studené a nudné, zimné večery pozitívny vplyv na výskyt počatí.

V ďalšom kroku by sme mohli vyhodnotiť celoročné dát štatisticky pomocou rovnakej analýzy ako Levy et al. Problém je v tom, že by sme takto získali zrejme kopu signifikantných výsledkov a takisto obrovskú variabilitu v dátach- okrem sviatkov by mal značný vplyv časť sezóny, deň v týždni alebo deň v roku. Lineárny model totiž nezohľadňuje že merané hodnoty tvoria časovú radu. V časovej rade sú po sebe nasledujúce hodnoty navzájom na sebe závislé. Ak dnes vážim 80 kilogramov tak zajtra nebudem vážiť 90 kilogramov, ale niekde okolo 80. Lineárny model posudzuje tieto časové merania ako nezávislé a vskutku strácame tak informáciu, že sa jedná o hodnoty merané v po sebe nasledujúcich dňoch. V merítku 14 dní to nie je také kritické, ale ak by sme porovnávali všetky dni v roku tak tu nám lineárny model nepomôže.

S ďalším príspevkom prišiel Aki Vehtari. Tu je jeho prvá analýza:

Vehtari použil Gausovský proces, pozostávajúci z dvoch pomaly meniacich sa trendov a jedného periodického trendu. Prvý graf znázorňuje dáta. Forma periodického procesu inferovaná na základe dát je znázornená v druhom grafe zhora. Je vidieť, že ide o týždenný trend. Spodná grafika je najzaujímavejšia. Znázorňuje reziduálnu variabilitu dát, ktorú model nedokázal vysvetliť. Modré krúžky zvýrazňujú extrémne hodnoty – dni, počas ktorých je pôrodnosť významne odlišná od predpovedí modelu. Je vidieť, že pôrodnosť na Valentína je naozaj významné vyššia a na Halloween významné klesá.

Model je možné obohatiť o ďalšie komponenty, zachytávajúce ďalšie potenciálne časové trendy v dátach. Druhá Vehtariho analýza vyzerá nasledovne:

Tento model má šesť komponent:
1. pomalý trend, zachytávajúci nárast pôrodnosti v 80. rokoch (modrá krivka, prvý graf).
2. 7-dňovy periodický trend. V druhom grafe zhora je vidieť, že pôrodnosť je nižšia cez víkend. Tento trend má medziročne silnejúci charakter
3. ročný sezónny periodický trend. V treťom grafe zhora je znázornený efekt studených zimných večerov.
4. extrémne hodnoty sú explicitne zohľadnené a modelované. V štvrtom grafe vidieť, že výnimky pripadajú na sviatky.
5. krátkodobý korelovaný šum. Neviem, či sa jedná o hnedú krivku v prvok grafe. Každopádne predpokladám, že ide o niečo na spôsob Markovského procesu.
6. reziduálny časovo nezávislý Gausovský šum.

Výhodou tohoto komplikovaného modelu je, že umožňuje zohľadniť alternatívne vysvetlenia. Hodnoty v štvrtom grafe sú ošetrené o ostatné vplyvy a trendy. Z tejto analýzy môžeme konštatovať, že Valentín a Halloween naozaj sú výnimočné. V prípade Halloweenu však ide o typický efekt sviatku. Počas sviatkov je pôrodnosť nižšia. To že Halloween nie je úradným sviatkom zdá sa nehrá rolu. Podobný efekt vidieť aj na prvého apríla. Zaujímavý je aj 29. Február. Zdá sa, že matky nechcú aby ich deti oslavoval narodeniny každé štyri roky. Vianoce so svojimi sviatkami sú samozrejme galiba pre pôrody. Mnohé presúvajú na obdobie medzi Vianocami a novým rokom.

Na záver teda možno skonštatovať, že efekt vyššej pôrodnosti prežil vyššie uvedené analýzy. Dôvody tohoto efektu budú zrejme kultúrne a psychologické ako tvrdia Levy a kolegovia. Ide o jediný sviatok cez ktorý počet pôrodov významne stúpa.  V prípade, že niekto príde s alternatívnou hypotézou môžeme túto samozrejme štatisticky otestovať.

Levy B.R., Chung P.H. and Slade M.D. (2011) Influence of Valentine’s Day and Halloween on Birth Timing. Social Science & Medicine. Vol. 73, 8, 1246–1248

Pridaj komentár

Zadajte svoje údaje, alebo kliknite na ikonu pre prihlásenie:

WordPress.com Logo

Na komentovanie používate váš WordPress.com účet. Log Out / Zmeniť )

Twitter picture

Na komentovanie používate váš Twitter účet. Log Out / Zmeniť )

Facebook photo

Na komentovanie používate váš Facebook účet. Log Out / Zmeniť )

Google+ photo

Na komentovanie používate váš Google+ účet. Log Out / Zmeniť )

Connecting to %s