Keď filozofom domácu úlohu zjedol pes

Už dávno som na Mozgostrojoch nenadával na filozofiu a myslím, že je na čase túto tradíciu, ktorá veselo sprevádzala Mozgostroje v začiatkoch obnoviť. Za ten rok som prešiel dve monografie, ktoré výrazne ovplyvnili moje vedecké zmýšľanie. To sú Jaynesova Probability Theory a Pearlova Causality. Obidve knihy vychádzajú zo snahy ponúknuť všeobecnú jednotnú teóriu – teóriu indukcie u Jaynesa a teóriu kauzality u Pearla. Takáto snaha mi vždy imponovala. V dobe rastúcej vedeckej špecializácie do podoborov podoborov sú snahy o zjednocovanie veľmi dôležité. Umožňujú zabrániť tomu aby každy podobor musel vynájsť koleso odznova, čo môže trvať desaťročia.

V zmysle, že filozofia je matkou vied a metavedou by úlohu zjednocovania mala hrať práve ona. Vskutku mnohí filozofi sa zaoberajú témami ako indukcia a kauzalita. Ak sa však pozrieme na výsledky filozofickej práce nájdeme presne to čomu by malo zjednocovanie zamedziť. Dochádza k propagácii nových ad-hoc riešení, ktoré plátajú dieru v záplate – v predchádzajúcej ad-hoc teórii, ďalšou záplatou. Často už takáto nová záplata existuje v nejakom inom obore a dochádza k situácii keď filozofi objavujú koleso od znova. Nie je ťažké vidieť, kde je problém. Pre náčrt zjednotenej teórie nemajú filozofi potrebné nástroje. Chýbajú im matematické formalizmy. Nás vedcov (na rozdiel napr. od inžinierov) nezaujíma či nejaké riešenie pasuje na nejaký čiastkový problém. Chceme ukázať, že určitý postup rieši všetky problémy určitej pokiaľ možno širokej množiny. Takto funguje Jaynesov kalkulus pravdepodobnosti a Pearlov kalkulus kauzality. Kalkulus poskytuje nekonečnú množinu výrokov určitého typu a ukazuje ako všetky tieto výroky vyhodnotiť. Kalkulus je v tomto zmysle jazykom vedy a mal by byť cieľom meta-vedeckého snaženia.

Zlyhanie filozofie je trojité. Po prvé nerieši problémy, ktoré by mala. Tieto ostávajú nevyriešené, keďže fyzici a matematici často nemajú záujem ani čas na výlety naprieč vedeckými obormi. Po druhé filozofia propaguje vlastné ad-hoc záplaty a tým pridáva svoj podiel ku kakofónii záplat naprieč vednými obormi. Po tretie, filozofia ospravedlňuje a dáva kredit záplatárskemu prístupu v očiach iných vedných oborov. Vskutku filozofovanie a metareflexia býva často identifikovaná s produkciou nesystematických ad-hoc riešení. Nasleduje diskusia týchto troch bodov.

Nie je mi známa filozofická práca, ktorá by ponúkla systematické jednotné riešenie po vzore Jaynesovho alebo Pearlovho kalkulu. (Jediné mne známe priblíženie by mohol tvoriť najnovší výskum Kevina Kellyho.) Čo je horšie takéto riešenia nie sú cieľom snaženia a ešte horšie ak aj existujú sú ignorované. Smutným dokladom posledného bodu sú diskusie práce filozofov k teórii pravdepodobnosti v Jaynesovej knihe. Napríklad v piatej kapitole píše Jaynes o Hempelovom paradoxe a Hempelovom odmietnutí riešenia, ktoré poskytol I.J. Good. Ad-hoc záplaty nájdeme neskôr v knihe aj v Carnapovej intuitívnej logike. Môžeme sa preniesť do súčasnosti. Obhajobu ad-hoc postupu môžeme nájsť napríklad u Dennetta. Jeho pumpy na intuíciu sú typickým nástrojom na generovanie ad-hoc riešení. Umožňujú rozpitvať zopár obmedzených problémov. Myšlienkové experimenty vo všeobecnosti vám pomôžu nanajvýš nájsť exotické prípady, v ktorých nejaká metóda zlyháva. Zovšeobecnenie nejakého riešenia neumožnia. To je dané tým že množina všetkých problémov je moc veľká poprípade nekonečná a naša predstavivosť si s týmito množinami neporadí. Na to musíme prejsť k formalizmom. Podobne môžem zhodnotiť prínos ostatných filozofov, ktorých diela sú mi známe. Chemero kritizuje predchádzajúce teórie prístupností avšak sám žiadne zásadné riešenie neponúka. Richardson kritizuje evolučnú psychológiu, náčrt programu pre výskum mysle nie je ani jeho cieľom. A tak môžem pokračovať cez Gilberta, Bechtela k Thaggardovi.

Žiaľ práca filozofov pridáva ad-hoc tvorbe na váženosti a serióznosti, takže výskumníci z iných odborov sú viac ochotní oddávať sa tejto tvorbe. Krátky príklad. Paul Meehl by mal byť známou postavou pre čitateľov Kahnemanovej poslednej knihy. Meehl bol všestranným bádateľom a okrem psychológie, medicíny, genetiky a práva sa zaoberal aj filozofiou. Meehl (1997) bol fanúšikom Popperovho falzifikacionizmu. Zároveň však akceptoval, že psychológia nedosiahne na štandard silného falzifikacionizmu používané vo fyzike. Psychologické teórie neposkytujú presné predpovede. Preto aj v prípadoch, keď sa predpovede nenaplnia úplne presne ale len čiastočne, teóriu predsa len akceptujeme. Zároveň pri testovaní teórii musíme postulovať tzv. vedľajšie predpoklady (napr. probanti sú motivovaní odpovedať pravdivo). Ak však výsledky nepotvrdili teóriu, môže sa tak stať lebo vedľajšie predpoklady neboli naplnené, a pri tom samotná teória je platí. Meehl preto navrhol tzv. index koroborácie: C= (1-D/S)(1-I/S), kde I je šírka intervalu hodnôt predpovedaných teóriou pre určitý pozorovateľný parameter, S je interval všetkých hodnôt, ktoré môže parameter nadobudnúť, D je rozdiel medzi predpovedanou a skutočnou hodnotou. Prvý člen vyjadruje Meehlovu intuíciu že malá odchýlka dát k pozorovaniam potvrdzuje teóriu. Druhý multiplikatívny člen vyjadruje intuíciu, že teória ktorej predpovede sú presné uprednostníme pred teóriami ktorých predpovede sú všeobecné. C je teda index s hodnotami od 0 do 1, kde 1 znamená silnú koroboráciu.Ako príklad uvádza Meehl genetickú teóriu ktorý predpodvedá dedičnosť v intervale 0.3 až 0.4 (percent párov identických dvoj, ktoré vykazujú nejaký fenotyp). Pritom sú možné hodnoty 0 až 0.5 a pozorovali sme hodnotu 0.28. Platí C = (1-(0.4-0.3)/0.5)(1-(0.3-0.28)/0.5) = 0.77.

Čitatelia tohoto blogu by mali v Meehlovom indexe hneď uviedieť Bayesovu vetu. Meehlov index nie je nič iné ako bayesiánska metóda odhadu parametrov. (1-I/S) je apriori pravdepodobnosť a (1-D/S) je vierohodnosť dát. Ak zoberieme Meehlov vzorec všeobecnejšie, tak Meehl znovuobjavil bayesiánske testovanie hypotéz – C = p(H|D) \propto p(D|H)p(H). Tento príklad má všetky črty ad-hoc práce. Systematické riešenie (pomocou teórie pravdepodobnosti a štatistiky) je odmietnuté. Namiesto toho akceptujeme posledný korpus ad-hoc záplat (Popperov falzifikacionizmus) a ak objavíme ďalšiu dieru (silný falzifikacionizmus nie je aplikovateľný na výskum v sociálnych vedách), tak vyrobíme ďalšiu ad-hoc záplatu (Meehlov index koroborácie). Vo väčšine prípadov sa ad-hoc záplatári okľukou dopracujú k tomu istému výsledku aký poskytuje systematické riešenie. Okrem strateného času z dôvodu okľuky, toto riešenie nie je systematické a v budúcnosti sa objavia ďalšie problémy, ďalšie diery a ďalšie záplaty.

V tomto príklade dobre vidieť rolu, ktorú hrá filozofia v propagácii ad-hoc riešení. Filozofia ospravedlňuje ad-hoc záplatárstvo a dáva mu akademický kredit. Hlavným argumentom Meehlovho článku bolo, že problémy testovaním nulových hypotéz (NHST) nie sú štatistického ale filozofického charakteru. Následne treba konfrontovať filozofickú literatúru a nájsť filozofické riešenie. Paradoxne Meehlovo “filozofické riešenie” je dávno známe v Bayesiánskej štatistike. Jedinou “pridanou hodnotou” filozofického prístupu je, že je to ad-hoc záplata.

Nakoniec chcem dodať, že ad-hoc teoretizovanie samo o sebe nemusí byť zlé. Môže pomôcť nájsť štrbiny v existujúcich teóriách. Ako som však na začiatku spomenul v prostredí exponenciálne rastúcej špecializácie sú to práve zjednocovacie snahy ktoré sú nutné. Na poli psychológie môžem uviesť hneď niekoľko prípadov, kde takéto snahy chýbajú.

1. Psychológovia stále nevedia čo je presne ich cieľom, ako by psychologická teória mala ideálne vyzerať a ktoré sú optimálne spôsoby ako sa k nej dopracovať. Psychológia je tak stále v dobe kamennej epistemológie. Dominantnou platformou je Popperov falzifikacionizmus kombinovaný s bizarnými predstavami Chomskeho a Fodora. Tento stav je o to pozoruhodnejší, že psychológia zažíva od svojich akademických začiatkov kontinuálnu krízu. Viac som o tom písal tu.

2. Chýba nám formálna teória intencionality. Myslím, že tu je pôda viac než zrelá. Pearlove kauzálne formalizmy rozšírené Bischofove koncepty by mohli byť dobrý východiskom.

3. Príbuzná otázka sa týka cieľovej úrovne vysvetlení. Marr postuloval 3 úrovne. Komputačná, procesná a implementačná úroveň. Marr tvrdil, že treba pracovať od komputačného k implementačnému vysvetleniu. Marrove predstavy sú typická ad-hoc záplata. Samotný Marr im nepripisoval veľkú váhu. Po viac než 30 rokoch kognitívny vedci stále nasledujú tento postup. Pozoruhodné je, že do tejto skupiny patria aj bayesiáni ako Tenenbaum, Griffiths alebo Chater. Títo nemajú problém formalizovať myslenie ľudí ako myslenie racionálnych agentov pomocou najnovších algoritmov. Avšak keď dôjde na to optimizovať vlastné myslenie ohľadom explanačnej úlohe psychologických teórii, tak tu uprednostia Marrov ad-hoc výhonok z doby kamennej informatiky. Spomenuté otázky pokladám za zásadné a ich riešenia mali byť už dávno na stole. Od filozofov sa žiaľ týchto riešení nedočkáme. Ešte horšie. Tieto otázky majú charizmu filozofických otázok, takže aj psychológovia majú tendenciu po vzore filozofie ich riešiť ad-hoc záplatami. Zrejme z podobného dôvodu aj matematicky zdatní vedci sa štítia formalizácie a uspokoja sa so záplatou.

Meehl, P. E. (1997). The problem is epistemology, not statistics: Replace significance tests by confidence intervals and quantify accuracy of risky numerical predictions. What if there were no significance tests, 393-425.

Kahneman: Thinking, Fast and Slow

Toto je snáď môj posledný príspevok Kahnemanovej knihy. V ňom chcem diskutovať niektoré menšie témy, ktoré som opomenul v minulých článkoch. Takisto chcem zhrnúť môj dojem z knihy. Samozrejme diskusia sa bude týkať Kahnemanovej teoretickej pozície. Kniha má pekný biely obal, priateľskú cenu a dobre sa číta. To nás na tomto mieste nezaujíma.

Kniha má 5 častí. Prvá časť sa zaoberá Systémom 1 (rýchla lenivá intuícia). V druhej časti Kahneman rozoberá svoj výskum biasov a heuristík. V tretej časti ukazuje, že biasy nájdeme aj u expertov – sudcov, maklérov alebo investorov. V štvrtej časti predstavuje svoju teóriu rozhodovania – t.j. prospektovú teóriu, ktorá sa stala základom behaviorálnej ekonómie. Piata časť sa venuje jeho výskumu šťastia a spokojnosti ľudí so životom. Druhá a štvrtá časť tvoria jadro Kahnemanovho výskumnej kariéry a jeho prínosu. Venoval som sa im v predchádzajúcich príspevkoch. Tu sa chcem krátko vrátiť k prvej časti knihy.

Prvá časť je venovaná Systému 1. Jadro evidencie tvorí psychologický výskum podvedomého vnímania. Výsledky väčšiny týchto štúdii sú dnes už dobre podložené a patria ku klasickým experimentom. Pred dvoma rokmi, keď kniha vychádzala by sme k nim zaradili aj štúdie venujúce sa tzv. sociálnemu primingu. Klasikou v tomto štýle je štúdia Bargha, kde študenti najprv riešili anagramy. Po tom čo študenti dokončili anagramy bola meraná rýchlosť, s ktorou prešli chodbou vedúcou z labáku k východu z budovy. Študenti sa pohybovali pomalšie ak anagramy obsahovali slová a výrazy vzťahujúce sa na starobu. Výskum sociálneho primingu prominentne figuruje v práve zúriacej kríze replikovateľnosti psychologického výskumu. Dobrý nedávny prehľad problémov so štúdiami sociálneho primingu nájdete tu. V skratke, súčasná situácia vyzerá nasledovne. Niekoľko publikácii demonštrujúcich sociálny priming bolo stiahnutých. Iné sa nepodarilo replikovať a počet neúspešných replikácii má stúpajúcu tendenciu. To je z Kahnemanovho pohľadu na prd, keďže na týchto výsledkoch vystaval odvážne tvrdenia vo viacerých kapitolách. So škodoradosťou si napríklad môžeme pripomenúť nasledujúcu pasáž z konca štvrtej kapitoly, ktorá sa zaoberá práve sociálnym primingom:

When I describe priming studies to audiences, the reaction is often disbelief. This is not surprise: System 2 believes that it is in charge and that it knows the reasons for its choices. […] The idea you should focus on, however, is that disbelief is not an option. The results are not made up, nor are they statistical flukes. You have no choice but to accept that the major conclusions of these studies are true. More important, you must accept that they are true about you (s. 56-57)

Zdá sa že Kahnemanovi tiež nie je z najnovšieho retroaktívneho vývoja evidencie dvakrát do skoku. Minulý rok reagoval na situáciu otvoreným mailom, kde vyzval výskumníkov sociálneho primingu aby očistili svoju výskumnú oblasť od pochybností. Z emailu vyplýva aj že Kahneman stále verí v existenciu týchto primingových efektov. Iní výskumníci tomuto výskumu toľko neveria a odzrkadľuje sa to aj na vnímaní Kahnemanovej knihy. Napríklad britský psychológ David Shanks zaradil vo svojej prednáške Kahnemanovu knihu do blacklistu momentálne trendovej pop-sci literatúry, tvrdiacej, že ľudské správanie je pod nadvládou podvedomých faktorov. Táto literatúra argumentuje aj výskumom sociálneho primingu.

Myslím, že Shanksova reakcia je v tomto ohľade prehnaná. Sociálny priming tvorí krátku a nie moc podstatnú časť knihy. Naopak Kahnemanov výskum biasov a rozhodovanie bol mnohokrát replikovaný. Vskutku viaceré výsledky si môže každý pre seba demonštrovať na stránkach knihy. V tomto zmysle sú podobné vizuálnym ilúziam. Na druhej strane, že Kahneman pripisuje nevydarené replikácie sociálneho primingu neschopnosti autorov týchto replikácii (lebo títo údajne nemajú expertízu a skúsenosť s primingom) mi moc nevonia. Na tejto reakcii, ale aj v autobiografických úsekoch knihy vidieť, že Kahneman patrí ku generácii psychológov, pre ktorých je dizajn a prevedenie experimentov viac umenie ako, ehm, veda. Aj Kahnemanove experimenty sú perfektne vyladené aby autori získali silný efekt. Problém takéhoto ladenia je, že vyladené experimenty sú citlivé na okolnosti a konfiguráciu prostredia – takže ich nemožno rovnako efektne replikovať v iných labákoch. Takisto výsledky následne nemusia zovšeobecňovať tak ako autori experimentu zamýšľali. Napríklad experiment na strane 7:

Písmeno k. Je pravdepodobnejšie že sa k objaví ako prvé alebo ako tretie písmeno slova?

Probanti tvrdia, že prvé je pravdepodobnejšie, pritom frekvencia slov kde k je tretie písmeno je vyššia. Kahneman a co. preukázali našli tento efekt pri písmenách (K,L,N,R,V). Kahneman tvrdý, že probanti volia prvé písmeno, lebo ľahšie dokážu vyvolať slová s prvým písmenom z pamäte. Gigerenzer a co. (Sedlmeier et al., 1998) vyskúšali aj ďalšie písmená avšak zistili, že Kahnemanove predpovede nezovšeobecňujú. Nie je ťažké si domyslieť čo sa stalo. Koniec koncov Kahneman sám s hrdosťou popisuje svoj postup pri dizajne experimentov. Nové problémy a úlohy vždy vyskúšali najprv na sebe. Ak u seba zistili bias tak úlohy vyskúšali na vzorke probantov, ktorý väčšinou ukázali rovnaké správanie. Problematická je vzorka úloh, ktoré u autorov nezafungovali a následne neboli testované ani publikované. Tieto úlohy v podstate končia v psychológovej zásuvke. Toto zásuvkovanie podkopáva reprezentatívnosť a robustnosť výskumu – jeho výsledkov a záverov. Pochybnosť týchto praktík samozrejme nebola vôbec tematizovaná v 80. a 90. a ešte aj dnes je povedomie medzi sociálnymi psychológmi nízke. Nie je ťažké si predstaviť, kde sa Kahneman a co. takýmto experimentálnym postupom inšpirovali. Kahneman na viacerých miestach porovnáva biasy s optickými ilúziami. Vizuálne vnímanie je robustné voči kognitívnemu a sociálnemu kontextu. Müller-Lyer ilúziu vnímame nezávisle od farby čiar, pozadia, kontrastu, nezávisle či je ilúzia znázornená na papieri alebo na monitore počítača, či sme už večerali, alebo či vieme, že ide o ilúziu a či vôbec vedome chceme zamedziť chybnému vnemu. Ilúziu v určitom rozsahu vnímame vždy. Kognícia a rozhodovanie sú naopak vysoko citlivé na kontext. V tomto prípade nemôžeme len tak na základe pozorovaní zopár mylných rozhodnutí v určitom kontexte zovšeobecniť na existenciu biasov. Musíme sa uistiť či výsledky nie sú ovplyvnené irelevantnými faktormi, ako je tvar písma, zvuk vyslovenej hlásky, veľkosť slovnej zásoby probanta alebo jazyk, ktorý používa.

Aby som to zhrnul. Myslím, že replikovateľnosť nie je pre Kahnemanovu teóretickú pozíciu kritická. Problém vidím v ekologickej validite – teda v otázke ako dobre možno výsledky zovšeobecniť. Najpresvedčivejšie mi pripadajú pozorovania biasov a chybného rozhodovania u expertov v rutinných úlohách. Rozhodovanie sudcov je ovplyvnené časom ich posledného jedla. Maklérov odhad hodnoty nehnuteľnosti je ovplyvnený kotviacim efektom. Rozhodovanie investorov a finančníkov netreba ani rozoberať. To neznamená, že ľudia chronicky trpia biasmi. Skôr to ukazuje, že kontext a spôsob rozhodovania v týchto prípadoch je zvolený nesprávne. Väčšina týchto rozhodovacích kontextov je netypická pre prirodzené sociálne prostredie s ktorým má človek najviac skúsenosti a ktoré ovplyvňuje jeho správanie. Interview je dobrý spôsob ako nájsť vhodného partnera/partnerku. To neznamená, že je to najlepší spôsob ako nájsť kompetentného zamestnanca. Nezávisle od odlišnej interpretácie príčin chybného rozhodovania sa môžeme zhodnúť s Kahnemanom, že rozhodovanie možno vylepšiť použitím alternatívnych rozhodovací stratégii alebo zmenou kontextu problému.

Kritiku Kahnemanovho spôsobu navrhovania experimentov možno zobrať zo širšieho pohľadu. Pre zvolenie zaujímavých, diagnostických experimentov je dôležitá teória a jej predpovede. U Kahnemana funguje teoretizovanie post-hoc a má deskriptívnu úlohu. Sarkasticky by sme mohli povedať, že Kahneman hľadá a zbiera zaujímavé prípady biasov. Ak takýto prípad nájde, následne popíše vedeckou terminológiou čo probant robí a toto nazýva teóriou. V predchádzajúcom článku sme videli príklady problémov vyhodnocovaním pravdepodobnosti udalostí – feministka Linda, farmár Štefan. Postulovaním vplyvu reprezentatívnosti/plauzibility na rozhodovanie Kahneman len preložil výsledky do vedeckého jazyka. Tento popis nepridáva pozorovaniam na hodnote. Neumožňuje totiž získať žiadne precízne kvantitatívne predpovede pre nové situácie. Presne toto však dokáže bayesiánsky formalizmus. Tento tým spĺňa aj explanačnú úlohu, ktorá je kritériom dobrej teórie. Kahneman pre mňa reprezentuje predteoretickú psychológiu. Kahneman je ako motýľkar, ktorý sa snaží na základe svojej zbierky zopár exotických exemplárov vytvoriť teóriu motýľov. V biológii predchádzali Darwinovej rôzne zberateľské a kategorizačné pokusy. Vedci pred Darwinom ponúkli hierarchie a taxonómie organizmov. Tieto pokusy boli dôležitým krokom na ceste k teórii evolúcie avšak boli čisto deskriptívne a v tomto zmysle nešlo o skutočné teórie. Podobne možno vnímať aj Kahnemanov pokus. Kahneman sa sám k k čisto deskriptívnym cieľom priznáva. Používa trochu inú metaforu – metaforu lekárskych diagnostických systémov. Rôzne diagnostické systémy ako ICD alebo DSM poskytujú lekárom spoľahlivé jednoduché pravidlá ako priradiť symptómy k diagnóze. Kahneman tvrdí, že cieľom jeho knihy je poskytnúť podobné kritéria, aby bežný človek mohol lepšie reflektovať svoje biasy a rozhodnutia. V konečnom dôsledky však medicínske diagnostické systémy vychádzajú z overených teórii a modelov fungovania ľudského tela. V tomto ohľade Kahnemanov klasifikačný systém zaostáva za svojimi medicínskymi proťajškami.

Kahneman, D. (2011). Thinking, fast and slow. Farrar, Straus and Giroux.

Sedlmeier, P., Hertwig, R., & Gigerenzer, G. (1998). Are judgments of the positional frequencies of letters systematically biased due to availability? Journal of Experimental Psychology: Learning, Memory and Cognition, 24, 754–770.

Rozhodovanie podľa teórie očakávaného úžitku

Dostal som sa k štvrtej časti knihy ale zasa sa neviem dopracovať k spokojnosti. Nepozdáva sa mi spôsob akým Kahneman modeluje predpovede teórie očakávaného úžitku.

Stručný popis teórie očakávaného úžitku (expected utility theory, EUT) si môžete prečítať na samorybných mémoch, tu sa budem sústrediť na modelovanie.

Kahneman tvrdí, že podľa EUT sa aktéri budú rozhodovať len na základe očakávaného úžitku. Napr. na strane 279 ponúka nasledujúci (mnou na pomeri chudobného slovenského študenta upravený) príklad:

A: 9 Eur naisto alebo 90% šanca vyhrať 10 Eur.

Čo si zvolíte? Väčšina ľudí volí istých 9 Eur. Neskôr na strane 315 Kahneman ukazuje, že suma, ktorú sú ochotní ľudia akceptovať v takýchto experimentoch je systematicky výrazne nižšia ako 9 Eur –  v priemere okolo 7.12 Eur. Kahneman takisto poskytuje hodnoty z experimentov pre rôzne percentuálne scenáre – “vaša šanca získať 10 Eur je p, koľko Eur ste ochotný akceptovať naisto namiesto tejto hry”. Hodnoty z tabuľky som uviedol do grafu (modrá krivka).

Kahneman tvrdí, že podľa EUT by mali byť rozdiely medzi intervalmi rovnomerné a teda akceptované hodnoty by mali byť identické s očakávanou hodnotou ako znázorňuje čierna krivka (s. 279, 311). Ľudia to však vnímajú inak. Ak sa dozviem, že moja šanca získať milión Eur stúpla zo 60 na 65 % alebo z 95 na 100 % tak tú poslednú správu vnímame ako oveľa radostnejšiu. Teda EUT sa mýli.

V EUT sa moc nevyznám a je možné, že naozaj existujú verzie, ktoré predpovedajú čiernu krivku v grafe vyššie. Ukážem však, že Bernoulliho pôvodná verzia EUT predpovedá inú krivku. Vychádzajme z príkladu A. Musíme vyhodnotiť očakávanú utilitu dvoch situácii. V prvej situácii získame 9 Eur k nášmu doterajšiemu majetku m a náš úžitok je daný ako u(A_1) =u(m+9), kde u je úžitková funkcia prepočítavajúca sumy peňazí na sumy šťastia. V druhej situácii náš očakávaný úžitok tvorí u(A_2)=0.9 u(m+10) + 0.1 u(m), teda úžitok z výhry plus prehre vážený respektívnou pravdepodobnosťou scenára. Aby sme sa rozhodli musíme určiť, ktorá z dvoch situácii nám prinesie viac úžitku. Aby sme to zistili potrebujeme definovať úžitkovú funkciu. Bernoulli ukázal, že konkávna funkcia je dobrou voľbou. Po vzore Bernoulliho môžeme použiť logaritmus. Ak úžitok prvej situácie má byť väčší, musí platiť

u(A_1)>u(A_2)

u(m+9)> 0.9 u(m+10) + 0.1 u(m)

log(m+9)> 0.9 log(m+10) + 0.1 log(m)

Vidíme zaujímavú vec. Rozhodnutie závisí od nášho súčasného finančného stavu m. V tomto konkrétnom prípade bude stratégia A1 výhodnejšia pre všetky pozitívne m. Môžeme však analyzovať všeobecnú situáciu:

u(m+c)> p u(m+w) + (1-p) u(m)

kde c je výhra pri voľbe istoty, w je výhra v hazardnom scenári a p je pravdepodobnosť tejto výhry. Pre logaritmickú úžitkovú funkciu platí:

log(m+c)> p log(m+w) + (1-p) log(m)

log(\frac{m+c}{m})> p log(\frac{m+w}{m})

\frac{m+c}{m}> (\frac{m+w}{m})^p

1+\frac{c}{m}> (1+\frac{w}{m})^p

c> m((1+\frac{w}{m})^p-1)

Istú ponuku sa nám oplatí akceptovať pre hodnotu c vyššiu/rovnú ako výraz vyššie. Pre w=10, p=0.9 a m=20 získame c>8.81. Teda Bernoulliho riešenie je naozaj ochotné akceptovať nižšiu ako očakávanú hodnotu. Graf nižšie ukazuje kritické c v závislosti od p a červenú krivku možné porovnať s modrou v prvom grafe. Bernoulliho EUT kvalitatívne modeluje to, čo Kahneman nazýva certainty effect.

Čo sa deje? V čom spočíva Bernoulliho trik? Trik je v použitý konkávnej úžitkovej funkcie. Ak by sme použili lineárnu funkciu u(x)=a x + b tak získame

u(m+c)> p u(m+w) + (1-p) u(m)

a(m+c)+b > p a (m+w) + (1-p) a m +b

a m+a c+b > p a m+pa w + a m-p a m +b

c >p w = E[w]

Kritickou hodnotou je teda c=pw, kde pw nie nič iné ako očakávaná výhra, ktorú Kahneman podsúva ako predpoveď EUT. V tomto prípade narazíme na problém, ktorý sa práve Bernoulli snažil vyriešiť. Pri lineárnej funkcii sa neoplatí nikomu uzavrieť poistku a ani nijak inak obchodovať s rizikami. Pre poisťovňu totiž platí c_p <p w (keďže w tvorí stratu), zatiaľčo klient chce c_k >p w . Za takýchto okolností (a za rovnakých očakávaní) žiadne kompromisné c neexistuje. Konkávna funkcia túto situáciu mení. Vráťme sa k vyššie uvedenému výsledku pre kritické c

c> m((1+\frac{w}{m})^p-1)

Člen (\frac{w}{m})^p vyjadríme ako binominálnu postupnosť.

(\frac{w}{m})^p= \sum_{k=0}^\infty \binom{p}{k}(\frac{w}{m})^k = 1 +p\frac{w}{m} -\frac{p(1-p)}{2} (\frac{w}{m})^2+ \sum_{k=3}^\infty \binom{p}{k}(\frac{w}{m})^k

Pre vysoké m sú vyššie členy v postupnosti (k>2) zanedbateľne malé. Dosadíme preto len prvé tri členy do vzorca pre c a získame

c> pw -\frac{1}{2m} p (1-p) w^2

Členy na pravej strane som schválne upravil do formy, ktorá ukazuje jednu zaujímavú vec. Prvý člen vyjadruje očakávanú výhru a druhý člen koriguje toto očakávanie o proporciu odchýlky odhadu w. Platí totiž, že Var[w] = p(1-p) w^2 , a teda

c> E[w] -\frac{1}{2m} Var[w]

Tento vzorec nám káže odpočítať od očakávanej výhry sumu proporčnú riziku stávky. Druhý člen tvorí niečo ako cenu poistky, ktorú sme ochotný zaplatiť aby sme nemuseli hrať s rizikom. Pre Bernoulliho bol dôležitý koeficient  \frac{1}{2m} . Tento závisí od sumy peňazí, ktorú vlastním. Ak som bohatý, tak som sám sebe poisťovňou a neistota výhry ma nemusí trápiť. Ak som chudobný, variabilita je problémom, lebo hrozí že skončím s holým zadkom. Výsledkom je situácia, v ktorej sa bohatým oplatí poskytovať poistky chudobným. Vskutku Bernoulli uvažoval nad stratami a nie nad výhrami. Vzorec pre akceptovateľnú istú prehru získame ak dosadíme -z za w.

c> -E[z] - \frac{1}{2m} Var[z]

V tomto prípade získame possibility effect pre nízke pravdepodobnosti. EUT správne modeluje averziu voči riziku (prvá a štvrtá bunka tabuľky na strane 317). EUT nezohľadňuje možnosť vyhľadávania rizika. Vzorce pre c sa snažia variability vyvarovať. Korekcia c ide vždy v smere pozitívnej variability. Táto je maximálna pri p=0.5 a klesá smerom k extrémnym hodnotám. Odklon červenej krivky od tej zelenej ilustruje zmenu variability v závislosti od p.

Zaujímavé je zamyslieť sa nad možnými úpravami vzorca pre c tak, aby tento modeloval vyhľadávanie rizika u ľudí. Najjednoduchšie by bolo obrátiť znamienko druhého člena v závislosti od p. Ďalší prístup možno získať zvážením vychýlenia rozdelenia pravdepodobnosti výhry. Riziko nie je vždy rozdelené rovnomerne okolo očakávanej hodnoty. Napríklad pre E[w=10]=9.9 bude väčšina variability sústredená medzi hodnotami nižšími ako 9.9. (Trochu inak, ak si predstavíme opakovanú sádzku tak konfidenčný interval bude  bude širší na číselnej osi vľavo od E[w]=9.9 .) Vychýlenie rozdelenia vyjadruje túto asymetriu a je dané štvrtým členom v binominálnej postupnosti. Rozšírený model o tento člen by mohol tvoriť zaujímavý model, ktorého špecifikáciu si na tomto mieste odpustím.

Viaceré príklady, ktoré Kahneman používa ako kritiku EUT by bolo treba náležite upraviť. Napríklad na stranách 334-337 sa zaoberá reťazou rozhodnutí. Ľudia volia inak ak zadanie kombinuje reťaz úloh do jednej úlohy ako postupne riešených úlohách. Vo vzorcoch vyššie vidíme, že rozhodnutie ohľadom c závisí aj od východzej sumy m. Ak je táto nižšia sme ochotní zaplatiť viacej za poistku za vykúpenie sa z rizika. To robí aj postupné úlohy inými úlohami ako úlohy v kombinovanom probléme. Východzia suma je totiž iná. Riešenie druhého problému v sérii od sumy získanej pri predchádzajúcom probléme. Myslím, že aj v prípade hypotetických úloh môžeme u ľudí očakávať takýto vplyv.

Čo sa týka normatívnosti, tu sú podľa mňa všetky cesty otvorené. Kahneman stavia očakávanú hodnotu do roly normatívu, od ktorého sa ľudia pod vplyvom possibility a certainty efektu odkláňajú. Medián, modus, variabilita môžu tvoriť za určitých okolností dôležité indikátory. Mnohé ekonometrické modely, podobne ako EUT, zohľadňujú variabilitu a volatilitu odhadov. Konkrétnym problémom ľudí je, že zohľadňujú riziká viac než by bolo treba. To zodpovedá podhodnoteniu východiskovej sumy m. Myslím, že toto je zmysluplné vysvetlenie prípadu úzkostlivého investora. Oproti m, ktoré používa investor vo svojom bežnom živote sú sumy, s ktorými narába pri investičných rozhodnutiach obrovské. S nevhodne nízkym m sa tak investor zľakne aj nízkych rizík.

Kahneman, D. (2011). Thinking, fast and slow. Farrar, Straus and Giroux.

Lewandowsky vs. klímaskeptická blogosféra

Meno Stephana Lewandowskeho padlo už na tomto blogu v súvislosti s jeho knihou o kognitívnom modelovaní, ktorej recenzia sa tu neskôr objaví. Lewandowsky okrem matematického modelovania pamäte a kategorizácie má aj bočný záujem vo výskume konšpiračného myslenia a kognitívnych mechanizmov, ktoré podmieňujú šírenie bludov a klamov. Minulý rok mu vyšiel článok, ktorý zhŕňa všetky dôležité poznatky (Lewandowsky et al., 2012). Tento rok práve vyšiel paper študujúci popieračov klimatických zmien a ich mémplex. V situácii, keď popieranie klimatických zmien a ďalšie mýty nedostanú v akademickej tlači žiadne miesto poskytujú blogy dobré útočisko. Klímaskeptické blogy ako http://wattsupwiththat.com alebo http://climateaudit.org fungujú ako ideologické getá, kde môžu čitatelia načerpať argumenty v prospech svojho mýtu.

Lewandowsky et al. (2013a) vytvorili krátky internetový dotazník pre klímaskeptikov. Tento bol zavesený na šiestych proklíma blogoch (klímaskeptické blogy boli oslovené ale odmietli sa podielať). Celkovo ho v priebehu dvoch mesiacov vyplnilo ca. 1500 užívateľov. Lewandowsky et al. sa okrem klimatologických názorov a konšpiračného myslenia sústredili na ďalšie konštrukty. Zaujímalo ich či dotyční myslia vo všeobecnosti protivedecky a aký je súvis s podporov laissez-faire voľnotrhových názorov. Na jednej strane je možné že títo ľudia sú celkovo poverčivi a skepsa ohľadom klímy je len jedna tehlička v ich komplexom scenári celosvetovej konšpirácie. Na druhej strane títo ľudia môžu len oportunisticky hájiť svoje ekonomické záujmy. Napríklad tabakové spoločnosti a fanúšikovia tabaku v 80. rokoch odmietali výsledky vedeckých analýz ukazujúcich súvis medzi fajčením tabaku, rakovinou a ďalšími ochoreniami. Samozrejme dotyční musia nejak vysvetliť ako sa nezávislé vedecké tímy dopracovali k rovnakým nesprávnym výsledkom. Najjednoduchšie je vytvoriť si konšpiračnú teóriu, kde práca vedcov je koordinovaná nejakou tajnou organizáciou v pozadí. Ďalším častým argumentom na obhajobu ekonomických záujmov je odvolanie sa na princípy laissez-faire trhového hospodárstva. Inak povedané regulácia konzumácie tabaku je apriori zlá, lebo ako každá regulácia obmedzuje slobodu ľudí.

Klimatická politika stojí v centre silných ekonomických a mocenských záujmov. Mnohí v USA hlavne pravicovo zmýšľajúci ľudia, tak odmietajú vedecké závery. Obidva argumenty z tabakového scenára možno znovu aplikovať. Konvergenciu vedcov k rovnakým záverom treba vysvetliť. Najskôr bude dôsledkom nejakej konšpirácie. Podobne politický zákrok proti otepľovaniu bude vyžadovať nejakú formu regulácie, čim je ohrozená sloboda rozhodovania aktérov na trhu.

Vyššie sú znázornené korelácie medzi jednotlivými konštruktmi. Autori podrobnejšie analyzovali súvislosti medzi konštruktmi pomocou štrukturálnych rovníc. Výsledky ukázali že klíma skeptici systematicky odmietajú vedu a oddávajú sa konšpiračnému mysleniu. Podpora voľného trhu silne súvisí s klímaskepsou a trochu menej s protivedeckým myslením. Posledné zistenie je zaujímavé, keďže pri protivedeckom myslení sa pýtali aj či HIV spôsobuje AIDS, kde ekonomické záujmy nie sú evidentné.

Nechcem sa tu zaoberať výsledkami štúdie. Internetoví diskutéri sú stelesnené stereotypy. Stačí vidieť názory jedného, hneď poznáte názory celého ich geta a žiadny veľký výskum nie je potrebný. Sranda nastala dva mesiace po publikovaní manuskriptu štúdie, keď si ju všimli klímaskeptické blogy a začali ju dekonštruovať. Autori zbadali v situácii príležitosť a celý vývoj pomocou Googlu a ďalších nástrojov ako Alexa  podrobne monitorovali. Vskutku autori zakrátko identifikovali viacero mýtov, ktoré sa o ich štúdii začali internetom šíriť. Klímaskeptici napríklad videli štúdiu ako konšpiráciu pro-klíma diskutérov, ktorí systematicky hromadne vypĺňali dotazník, aby v následných analýzach vykreslili klímaskeptikov ako magorov. Ďalší popierali, že autori kontaktovali s dotazníkom skeptické blogy, že dáta zo štúdie boli prezentované (na konferencii) už predtým ako bol ich zber možný – a teda vyfabrikované. Keďže poradie otázok bolo náhodne generované ozvalo sa aj podozrenie, že skeptické blogy dostali iný dotazník. Objavili sa aj bizarnejšie teórie. Napríklad Lewandowského univerzitný profil bol v jeden deň z určitých krajín neprístupný, čo niektorí diskutéri vzali osobne ako cenzúru ich IP adresy vedením austrálskej univerzity. Ďalší diskutér však hneď kontroval: “Watch, they may unblock you just so they can say you are paranoid, hyper-sensitive, were never really blocked” a ďalší “If it’s true they are selectively blocking, I have to begrudgingly respect the skill with which they are playing this audience: there is no way for anyone to complain without matching the stereotypical conspiracist of the study!”.

Nakoniec sa objavili aj názory, že publikácia štúdie Lewandowského et al. (2013a) bola len návnadou, aby vyprovokovali skeptikov na reakcie, ktoré sú pravým cieľom štúdie. Zdá sa že Lewandosky et al. to zobrali s humorom a na túto konšpiračnú hru pristúpili. Ich štúdia o reakciách blogosféry na ich prvú štúdiu vyšla vo Frontiers (Lewandosky et al., 2013b) a je tohtoročným horúcim kandidátom na Ig Nobelovu cenu.

P.S. zdá sa, že Frontiers si nie je tak celkom istý finálnou verziou poslednej štúdie a pdf bol dočasne stiahnutý z webu. Nepochybne ide len o ďalšiu snahu NWO vyprovokovať konšpiračnú reakciu klímaskeptikov a tak sa môžeme tešiť na pokračovanie tejto ságy.

Lewandowsky, S., Ecker, U. K., Seifert, C. M., Schwarz, N., & Cook, J. (2012). Misinformation and its correction continued influence and successful debiasing. Psychological Science in the Public Interest, 13(3), 106-131.

Judea Pearl: Causality (Časť 4)

V tomto článku rozoberiem posledné 4 kapitoly (7.-10.) Pearlovej knihy. Siedma kapitola, tak ako 2., 3. a 5. kapitola je nabitá obsahom zatiaľčo kapitoly 8., 9. a 10. sú venované diskusiám a rôznym lemám a zovšeobecneniam. V 2. a 3. kapitole sme sa zaoberali kauzálnymi grafmi. Tieto vyjadrujú všeobecnú kauzálnu štruktúru napríklad, že chodec ktorého zrazí auto zomrie. Kauzálna štruktúra platí pre všetky možné modely,kde príčina x ovplyvňuje výsledok y y = f_y(x,u_y) (kde u_y vyjadruje vplyv latentných faktorov). Štrukturálne rovnice (kapitola 5.) špecifikujú f(\dot) a sú tým pádom konkrétnejšie. V prípade auta ktoré zrazilo chodca môže napríklad štrukturálna rovnica vyjadrovať pravdepodobnosť úmrtia v závislosti od rýchlosti auta y = \sigma(x-20 + u_y), kde x je rýchlosť v km/h, \sigma je sigmoidálna funkcia a u_y \sim \mathcal{N}(\mu = 0, \sigma = 5) vyjadruje neistotu prameniace z neznalosti ostatných faktorov ako je zdravotná kondícia obete, v akej pozícii do človeka auto narazilo a.t.ď.

Kapitola 7. sa zaoberá ešte detailnejšou znalosťou, znalosťou hodnoty, ktorú u_y nadobudlo v konkrétnej situácii. Štrukturálna rovnica platí pre všetky situácie. Znalosť u_y vyjadruje konkrétnu situáciu napríklad, že Fera včera zrazilo auto na prechode pri rýchlosti 70 km/h, konkrétnej konfigurácii okolností zhrnutej do hodnoty u_y=30. Aj v tomto prípade môžeme vykonať zaujímavé analýzy, konkrétne môžeme sa zaoberať hypotetickými úvahami. (Tzv. counterfactuals u Pearla aj keď Pearl považuje tento názov za nevhodný, keďže vyjadruje protichodnosť). Môžeme sa spýtať či by chodec zomrel ak by auto išlo pomalšie a teda napríklad či je auto dostatočnou, nevyhnutnou príčinou úmrtia. Takéto otázky sú vysoko relevantné pri testovaní medikamentov a v právnych sporoch. Žiaľ tradičná štatistika má s nimi problémy. A to napriek tomu, že ľudia takéto hypotetické otázky rutinne hodnotia. V našom príklade je hodnota u_y=30 natoľko vysoká že aj keby auto stálo na mieste x=0 chodec by na zrážku zomrel. Toto zodpovedá vysoko nepravdepodobnej situácii (vskutku p(u_y \ge 30) < 0.001), že chodec idúc cez cestu sa šmykol, pri páde narazil do zaparkovaného auta a na následky zranení po náraze zomrel. V tomto prípade je nepravdepodobné, že auto spôsobilo smrť.

Formálne môžeme vyhodnotiť takéto situácie nasledovne. Potrebná je znalosť grafu a štrukturálnych rovníc. Konkrétna znalosť u nie je potrebná (a keďže ide o latentné faktory ich pozorovanie mnohokrát ani nie je možné). Tieto môžeme odhadnúť na základe pozorovaní ostatných faktorov. Napríklad v lineárnom modeli tvoria u rezídua, teda odchýlku pozorovaných hodnôt od predpovedí. Pri hypotetických výrokoch nás zaujíma pravdepodobnosť, že dôsledok Y nadobudne hodnotu y, ak X zmeníme na x pri latentných okolnostiach U=u,  p(Y=y| do(X=x),U=u). Pearl v tejto časti knihy používa zjednodušenú notáciu p(y_x(u)), ktorú preberiem aj v tomto článku. Inferencia p(y_x(u)) prebieha v troch krokoch.

1. Abdukcia. Na základe pozorovania Y=y’, X=x’ a všetkých ostatných meraných faktorov W=w’ odhadneme rozdelenie U=u.

2. Modifikácia. Prevedieme operáciu do(X=x). V 3. kapitole sme videlo, že to znamená modifikáciu grafu a štrukturálnych rovníc, tak že X nie je závislé na svojich rodičoch v grafe ale nadobúda pevne stanovenú hodnotu x.

3. Predpoveď. V modifikovanom grafe dosadíme U=u a vypočítame pravdepodobnosť p(Y=y).

Podobne ako v tretej kapitole ponúka Pearl kalkulus hypotetického myslenia, ktorý umožňuje systematicky zredukovať hypotetické výroky na formulu, ktorá pozostáva len z pozorovaných pravdepodobností (a túto pravdepodobnosť je možné určiť). Pravidlá sú nasledovné. Pre množiny premenných X, Y a W platí:

1. Kompozícia: W_x(u)=w \Rightarrow Y_{xw}(u)=Y_x(u). Ak W nadobúda hodnotu w za podmienok u tak môžeme manipuláciu w za rovnakých podmienok odstrániť z dolného indexu, keďže táto manipulácia hodnotu W nijak neovplyvní.

2. Efektívnosť: X_{xw}(u)=x pre všetky X a W. Manipulácia X zmení X nezávislé od hodnôt ostatných premenných W.

3. Obrátiteľnosť: (Y_{xw}(u)=y) \wedge (W_{xy}(u)=w) \Rightarrow Y_x(u)=y. Rovnosť vyjadruje predikát, že medzi premennými nie je možný feedback. V opačnom prípade vyhodnotenie hypotetických výrokov nie je možné.

Tieto tri pravidlá umožňujú určiť, či je vyhodnotenie hypotetického výroku možné a ak áno nájde formulu pre výpočet.

V podstate všetky aplikácie hypotetických úvah ktorými sa Pearl zaoberá v nasledujúcich kapitolách 8,9,10 vychádzajú z binárnych náhodných premenných. Toto dáva zmysel, keďže väčšina hypotetických úvah má takúto štruktúru, značne to zjednodušuje vysvetlenia a v zásade všetky kontinuálne premenné možno redukovať na binárne pomocou prahovej hodnoty. Napríklad kontinuálnu rýchlosť vozidla v príklade vyššie môžeme redukovať na binárnu premennú x>20.

V 8. kapitole Pearl rozoberá nedokonalé experimenty. Dobrým príkladom je napríklad farmakologická štúdia, v ktorej nie všetci probanti dodržali program dávkovania. Buď ho niektorí v experimentálnej skupine zanedbali alebo si zúfalí pacienti v kontrolnej skupine potajme medikament zadovážili. Ak máme informáciu o dávkovaní môžeme naše odhady kauzálneho vplyvu medikamentu na zdravie korigovať. Hypotetické úvahy hrajú dôležitú úlohu. Pri nedokonalých experimentoch totiž musíme vyhodnotiť hypotetický scenár, ak by probant ktorý liek nevzal, vykonal inak, aký dopad by to malo na jeho zdravie.

V deviatej kapitole sa Pearl zaoberá nevyhnutnou a postačujúcou príčinou. Napríklad prítomnosť kyslíka v miestnosti je nevyhnutná aby sme založili oheň. Kyslík je teda nevyhnutnou príčinou ohňa. Naopak ak sme odsúdili väzňa na odstrel, ktorý vykonajú traja paralelní strelci A, B, C tak výstrel strelca A nie je nevyhnutnou príčinou smrti väzňa, lebo väzeň by zomrel aj keby by A nevystrelili. Naopak výstrel každého zo strelcov je postačujúci na to aby väzeň umrel (vychádzajúc z toho, že strelci deterministicky splnia povel). Naopak kyslík nie je dostatočnou príčinou. Vo väčšine miestností s kyslíkom nehorí. Dodatočná udalosť je nutná (napr. škrtnutie zápalky), aby oheň vypukol.

Pravdepodobnosť, že X je nevyhnutnou príčinou Y je daná ako

p(y'_{x'}|x,y)=\frac{p(y)-p(y_{x'})}{p(x,y)}

Pravdepodobnosť, že X je postačujúcou príčinou Y je daná ako

p(y_x| y',x')= \frac{p(y_x)-p(y)}{p(x',y')}

Kde X, Y a U sú binárne premenné a y',x' a u' sú komplementárne hodnoty ku x,y,u.

Aby sme určili členy p(y_{x'}), p(y_x) v rovniciach vyššie sú potrebné experimentálne štúdie. Naopak aby sme určili p(y',x'), p(y,x) sú potrebné pozorovania. V experimentoch je totiž x manipulovaná, tým pádom nepoznáme prirodzené rozdelenie x. Pearl však ukazuje, že za zmysluplných predpokladov možno použiť jednoduchšie rovnice, ktoré vychádzajú len z experimentálnych dát alebo len z pozorovaní.

Nakoniec v desiatej kapitole sa Pearl zaoberá konkrétnymi a všeobecnými príčinami. Napríklad vo výroku “nadmerné pitie alkoholu môže viesť k úmrtiu” možno označiť alkohol ako všeobecnú príčinu úmrtia. Naopak v tvrdení “náš ruský kamarát Alexei zomrel po vypití litra vodky na otravu alkoholom” možno označiť alkohol ako konkrétnu príčinu. Formálne, v obidvoch situáciách je známa kauzálna štruktúra a takisto model daný štrukturálnymi rovnicami. Pri konkrétnych príčinách však dodatočne poznáme aj hodnoty niektorých latentných premenných. Tieto sú dané práve znalosťou konkrétnej situácie “Alexei, náš ruský kamarát …”. Táto znalosť môže zjednodušiť štrukturálne rovnice a viesť k redukovanému grafu. Napríklad y = ax + buz môžeme zredukovať na f_i = ax_1 ak vieme, že u=0. Redukovaný graf nazýva Pearl kauzálnym lúčom. V tomto grafe môžeme následne vyhodnotiť pravdepodobnosť, že x je príčinou y. Táto pravdepodobnosť vyjadruje pravdepodobnosť konkrétnej príčiny. Napríklad u=0 môže vyjadrovať fakt, že Alexei nepožil dodatočne žiadne drogy a teda že drogy z nemali vplyv na jeho úmrtie. V opačnom prípade by bola pravdepodobnosť, že alkohol bol konkrétnou príčinou jeho úmrtia nižšia.

Snáď nemusím dodať, že Pearlova kniha sa mi veľmi páčila. Kniha patrí do môjho obľúbeného štýlu tvrdohlavých monografii. Koncepty sprostredkované v knihe nie sú ťažké. Hlavnou ťažkosťou je vyvodiť z nich aplikácie a prevziať ich do praxe. Nemyslím, že hlavným problémom by pritom bola ich zriedkavá aplikovateľnosť. Práve naopak. Pearlova kauzalita poskytuje dôležité informácie pre psychologickú výskumnú prax a takisto ako ukázali Tenenbaum a ostatní môže byť inšpiráciou pre modeli kauzálneho myslenia u ľudí. Nepochybujem, že viaceré aplikácie Pearlovej kauzality v kognitívnych vedách uvidíme ešte ďalších článkoch na Mozgostrojoch.

Geopolitický dopad Zombie


Toto je posledný článok o Zombie. V ňom sa chcem venovať Dreznerovým (2010, 2011) analýzam vývoja medzinárodných vzťahov, ak by došlo k útoku Zombie. Viaceré teoretické pozície sa snažia ozrejmiť fungovanie medzinárodných vzťahov. Zároveň tvoria odlišné predpovede budúceho vývoja. Čiastočne tak umožňujú dospieť k normatívnym záverom – odporúčajú aké konanie je z pohľadu záujmov konkrétneho aktéra najvýhodnejšie. Drezner (2010) rozoberá tri hlavné pozície a ich predpovede geopolitického vývoja v prípade Zombie apokalypsy. V rámci každej pozície by pritom bolo možné identifikovať viaceré rozličné podprúdy. V tejto analýze sa však sústredíme na ich hrubé spoločné črty.

Liberalizmus

Liberáli tvrdia, že kooperácia medzi ľudmi a teda aj národmi a štátmi je win-win situácia. Každý z kooperácie profituje. Preto sa oplatí kooperovať, čoho historickým dôsledkom je nástup globalizácie, kapitalizmu a voľného trhového hospodárstva.  Zombie nie sú ochotní/schopní kooperácie a preto tvoria hrozbu pre liberálnu spoločnosť. Paradoxne práve niektoré politické stratégie tradične obhajované liberálmi ako otvorené hranice a ochrana súkromného vlastníctva (napr. súkromných cintorínov) môže urýchliť šírenie zombie epidémie. Liberáli predpovedajú, že sa ľudia zoči-voči zombie spoja a vytvoria organizáciu, ktorej úlohou bude potlačenie zombie hrozby. Túto úlohu by mohla prevziať napríklad OSN, ktorá by bola zrejme premenovaná na Organizácia Spojených Živých Národov. V rámci humanitárnych misii by tak OSN poskytovala mandát na intervenčné misie snažiace sa o potlačenie zombie hrozby vo “failed states” – v regiónoch, kde si miestna vláda s touto hrozbou nevie poradiť. To by bol najskôr prípad chudobných afrických štátov. Liberáli by zrejme uznali, že toto riešenie nebude optimálne a niektoré regióny budú stratené a v iných regiónoch povedie k trvalému konfliktu. Väčšina štátov sa však podarí ochrániť pred zombie epidémiou a vo vyspelom svete sa hrozba obmedzí na zopár zriedkavých zásahov v okolí cintorínov a v pivniciach notorických nekrofilov.

Neokonzervatizmus

Neoconi majú v rozdelení sveta jasno. Svet sa delí na spojencov a na os zla. Môžete si tipnúť kam sa asi zaradia zombie. Zlo musí byť zničené. Neoconi navrhujú pohotovú a drvivú vojnovú intervenciu proti zombie. Jej cieľom je vyhubiť túto hrozbu do posledného zombie. Neokonzervatívna politika je konzistentná s epidemiologickým modelom Munza a kolegov, ktorý som predstavil v predchádzajúcom príspevku. Munz et al. ukázali, že len rýchla, pohotová a drvivá intervencia môže byť úspešná. Na druhej strane neokonzervativci môžu veľmi pohotovo lokalizovať niektorých (živých) diktátorov a autoritárske vlády na osy nemŕtveho zla (“axis of evil dead”). Koniec koncov zombie sú najskôr len biochemickou zbraňou vyvinutou týmito diktátormi. To môže viesť k rozšírenému konfliktu medzi ľuďmi a ľudskými národmi.

Realizmus

Realisti popierajú, že cieľom ľudí je kooperovať alebo, že svet sa delí na apriori zlých a dobrých. Podľa realistov medzinárodnú politiku určuje moc a túžba po moci. V tomto aspekte sa ani zombie nelíšia od ľudí (moc = viac čerstvých mozgov k večeri). Mocné štáty sa môžu pokúsiť využiť zombie ako biologickú zbraň alebo ako zámienku pre “mierotvorné” misie v štátoch zamorenými zombie, napríklad za účelom získania prístupu k nerastným surovinám. Podľa realistov by sa tak geopolitická štruktúra s nástupom zombie zásadne nezmenila.

Posúdenie relatívnej aplikovateľnosti jednotlivých teórii necháva Drezner na čitateľovi. Možno budúcnosť ukáže, ktorá teória bola bližšie k pravde.

Týmto sa dostávame k záveru cyklu článkov o zombie. Veda je najlepšou a vskutku jedinou metódou ako sa dopracovať k spoľahlivým poznatkom o fungovaní sveta. To platí aj v prípade zombie apokalypsy. Na rozdiel od upírov, duchov, lichov a iných návštevníkov zo záhrobia (ako dokladá hollywoodsky folklór) mierové spolunažívanie so zombie je nanajvýš nepravdepodobné. Zombie sú preto dôležitou hrozbou, ktorú sa neoplatí ignorovať. Ako ilustrovali články v tejto sérii, vedci sa touto hrozbou výdatne zaoberali a práve vďaka ním sme na zombie hrozbu dobre pripravení. Ježiš môže kľudne povstať druhýkrát.

Drezner, D. W. (2010). Night of the Living Wonks. Foreign Policy, 180, 34-38.
Drezner, D. W. (2011). Theories of international politics and zombies. Princeton University Press.

Epidemiológia Zombie Útoku


V predchádzajúcich článkoch sme videli ako zombie infekciu diagnostikovať. Čo však robiť ak zistíme výskyt zombie v populácii? Ako predpovedať osud ľudskej rasy a ako najlepšie proti zombie zakročiť?

Munz s kolegami (2009) predstavili epidemiologický model Zombie útoku, ktorý nám umožňuje vyššie uvedené otázky zodpovedať. Najjednoduchšia verzia tohoto modelu vychádza z troch skupín populácie – živí (L), mŕtvi (D) a zombie (Z). Nasledujúce rovnice definujú dynamiku vývoja populácie. Autori ich navrhli na základe dôkladnej rešerše literatúry o zombie.

L = \beta L - \delta L - \alpha LZ

Ľudia. Prvý člen vyjadruje počet pôrodov, druhý člen prirodzený úbytok obyvateľstva v dôsledku úmrtia a tretí člen úbytok obyvateľstva v dôsledku zombie útokov. Tretí faktor závisí od počtu ľudí aj od počtu zombie. Čím viac ľudí a zombie, tým pravdepodobnejšie je ich vzájomné stretnutie a konfrontácia.

D = \delta L + \gamma LZ - \zeta D

Mŕtvy. Prvý člen vyjadruje počet prirodzených úmrtí. Druhý člen tvoria zombie, ktorých ľudia usmrtili a títo sa tak môžu znova vrátiť do stavu odpočinku. Znova pravdepodobnosť zabitia zombie človekom závisí od pravdepodobnosti ich stretnutia a teda od počtu zombie a počtu ľudí. Tretí člen vyjadruje úbytok mŕtvych v dôsledku vzkriesenia do stavu zombie. Hnusné na tomto modeli je, že aj ľudmi zabití zombie môžu byť znova vzkriesení.

Z = \alpha LZ - \gamma LZ + \zeta D

Zombie. Prvé dva členy vyjadrujú pribúdanie a ubúdanie zombie v dôsledku stretnutiami s ľudmi. Tretí člen vyjadruje prírast zombie v dôsledku vzkriesenia.

Munz s kolegami analyzovali tento model a viaceré jeho rozšírené verzie. Základná verzia má dva rovnovážne stavy – populáciu tvoria buď zombie alebo ľudia. Rovnovážne spolunažívanie teda nie je možné. Pritom rovnovážny stav kde populáciu tvoria ľudia nie je stabilný. Stačí jeden jediný zombie a v priebehu krátkeho času bude ľudstvo vyhubené. Graf nižšie ukazuje, že na naplnenie takéhoto scenára stačí 5 dní (pri počiatočnej populácii 500k ľudí).

Autori štúdie sa nevzdali a vyskúšali rôzne formy prevencie proti zombie útoku.

A. Karanténa umožňuje izolovať zombie takže títo nemôžu infikovať ďalších ľudí. Tento scenár dokáže nanajvýš spomaliť vyhubenie ľudstva, avšak katastrofu sa ním odvrátiť nepodarí.

B. Ľudstvo vynašlo liek ako zombie premeniť naspäť na človeka. Tento liek však ľudí neimunizuje proti ďalšej zombie infekcii. Graf nižšie ukazuje, že touto taktikou sa podarí odvrátiť katastrofu, zombie sa však vyhubiť nepodarí. Jediný stabilný rovnovážny stav tvorí zmiešaná populácia dominovaná zombie.

C. Nakoniec autori vyskúšali taktiku masívneho hubenia zombie, napr. pomocou zbraní hromadného ničenia. Grafika nižšie znázorňuje vývin zombie populácie po zásahoch ktoré zničili 25, 50 a 75 % populácie zombie. Grafika ukazuje, že len jednorázový zásah, ktorý kompletne vyhubí celú populáciu zombie môže byť úspešný.

Autori, preto odporúčajú pre prípad zombie epidémie pohotový, rýchly a tvrdý útok. Inak sú šance ľudstva na prežitie mizivé.