Zombie medzi nami

Pomaly sa blíži rok existencie Mozgostrojov a je možné rekapitulovať nakoľko bola snaha o ovládnutie sveta úspešná. V prvom roku mal blog skromný cieľ – ovládnuť československú blogosféru. Výsledky tejto snahy sú zmiešané. Na jednej strane sa podarilo vyradiť hlavný konkurenčný blog Massive Error. Filip Tvrdý evidentne nezvládol nástup Mozgostrojov a konfrontáciu vzdal. Žiaľ čitateľov ME sa počas uplynulých mesiacov nepodarilo tak celkom získať. Pristúpil som, preto k stratégii dočasne emulovať štýl a marketingové triky ME. ME minulý rok prezentoval pri príležitosti veľkej noci – kresťanského sviatku Ježišovho zmŕtvychvstania, sériu článkov zaoberajúcich sa kresťanstvom. Kresťanstvo a kresťanské príbehy o Zombie nepatria medzi témy, v ktorých sa vyznám a ktoré by ma zaujímali. Rozhodol som sa preto zobrať tému širšie a pripravil som sériu článkov o Zombie. Predsalen, Ježiš, okrem toho, že bol kresťan, bol, technicky vzaté, Zombie. A tak nielen kresťania ale aj Zombíci majú čo oslavovať.

V prvom článku musíme ujasniť, kto je a kto nie je zombie. Zombie sú definovaný ako nemŕtvi ľudia, ľudia ktorí prekonali smrť, ale žijú ďalej. V hollywoodskych filmoch sú znázornení ako pohybujúce sa mŕtvoly. Treba dodať, že takýto výzor nie je súčasťou definície a vskutku môžu existovať Zombie, ktorý vyzerajú ako živí ľudia ale sú mŕtvi. Niektorí filozofi dokonca rozšírili túto definíciu, tak že zombie sa správajú presne ako ich hypotetické živé proťajšky. Takže ako zistiť či je niekto zombie? Samozrejme môžeme sa ľudí spýtať, či sú zombie. Je Fero zombie? Spýtali sme sa Fera. Fero tvrdí, že nie je. Úľava. Ešteže tak. Problém je v tom, že príslušnosť k Zombie je sociálne ošemetná téma. Priznanie príslušnosti by mohlo viesť k diskriminácii, sociálnemu odmietnutiu, prenasledovaniu alebo pochovaniu zaživa. Zombíci sú preto, či už vedome alebo nevedome motivovaní zatajiť svoju posmrtnú príslušnosť.

Podobným problémom čelili sociálni psychológovia už v minulosti. Napríklad, nemá moc zmysel sa pýtať niekoho či je rasista, lebo každý vám povie, že nie, nie, nie. Psychológovia preto prišli s takzvanými implicitnými testmi. Najznámejším takýmto testom je Implicit Association Test (IAT). Verzia testujúca rasizmus môže vyzerať napríklad nasledovne. V strede obrazovky počítača sa objavujú rôzne slová. V prvej fáze, probant musí určiť stlačením klávesy, či zobrazené slovo asociuje so slovom “biely” (ľavé tlačítko) alebo “čierny” (pravé tlačítko). V druhej fáze asociuje zobrazované slová so slovami príjemný a nepríjemný. Nasledujú dve fázy, ktoré prezentujú kombinované úlohy. Probanti musia určiť či prezentované slovo patrí do kategórie biely/príjemný alebo čierny/nepríjemný resp. biely/nepríjemný alebo čierny/príjemný v poslednej fáze. Ak probandi asociujú biely s príjemným tak bude pre nich táto úloha jednoduchšia a ich reakcie budú rýchlejšie, lebo nemusia riešiť konfliktné situácie. Úloha nám umožní zistiť reakčné časy a tak na základe ich rýchlosti v posledných dvoch fázach môžeme zistiť či pre probantov je slovo čierny konzistentnejšie so slovom príjemný alebo nepríjemný a aký silný je tento rasistický bias. Podobný test môžeme vyvinúť pre iné tabuizované témy. Napríklad, môžeme zistiť, či je niekto Zombie. A to nezávisle od toho či nám to chce povedať a či si je toho faktu vôbec vedomý.

Takýto Zombie test bol implementovaný a môžete ho nájsť (v angličtine) tu. Test zaberie ca. 5 minút. Umožní vám spoľahlivo zistiť, či je vaša mamka alebo dedko Zombie. Dokonca ak si nie ste istý vlastnou posmrtnou identitou, tento test vám pomôže. Do toho!

Reklamy

Kahneman, štatistika a kauzalita

Práve čítam Kahnemanovu knihu Thinking, Fast and Slow. Niektoré aspekty si zaslúžia komentár a tento prvý článok sa zaoberá štatistickým myslením, ktoré Kahneman diskutuje hlavne v druhej časti knihy. V skratke, Kahneman (2011) zastáva nasledujúcu pozíciu. Ľudia v opantaní Systému 1 (rýchla, lenivá intuícia) nie sú schopní štatistického myslenia. Podceňujú variabilitu, zjednodušujú výpočty a výsledkom sú nesprávne predpovede a unáhlené závery. Hlavný hriech vidí Kahneman v nadmernom pripisovaní kauzálnych príčin náhodným udalostiam.

S Kahnemanovými príkladmi a interpretáciami celkom nesúhlasím. Vidím nasledujúce dva súvisiace problémy:

1. (Frekventistická) štatistika (80. rokov) je považovaná za normatívny ideál racionality – toho čoho je Systém 2 schopní a toho čo Systém 1 nerobí.

2. Nie je jasné či probanti interpretujú inštrukcie a otázky tak ako ich interpretujú Kahneman resp. štatistika.

Začnime príkladom z úvodnej kapitoly:

Váš sused vám popísal nasledujúcu osobu: “Števo je veľmi ostýchavý a uzavretý, vždy nápomocný avšak s slabým záujmom o spoločnosť a sociálne činnosti. Tichá a puntičkárska duša, rád má poriadok a systematickosť” Je Števo s vyššou pravdepodobnosťou knihovník alebo farmár? (Kahneman, 2010, s. 7)

Ľudia odpovedajú, že knihovník, keďže popis osoby lepšie sedí na knihovníka. Tento záver je podľa Kahnemana mylný, keďže knihovníkov je oveľa menej ako farmárov. Vyjadrené Bayesovou vetou p(F|E) = p(E|F) p(F) a p(K|E) = p(E|K) p(K), kde F znamená, že Števo je farmár, K knihovník, E je evidencia teda vyššie uvedený popis Števa. Probanti zrejme modelujú p(S=F)=p(S=K)=0.5 a zamieňajú p(F|E) s p(E|F), čo je nesprávne.Správne riešenie je dané Bayesovou vetou a apriórne pravdepodobnosti by mali prebiť evidenciu danú nejasným popisom.

Predstavte si, že by sa vás známy spýtal podobnú otázku, alebo že by ste ju dostali ako pokusný králik v psychologickom experimente. Odpovedali by ste inak ak by ste vedeli, že p(F)>>p(K) a poprípade táto znalosť bola súčasťou zadania. Ja by som odpovedal rovnako a apriórne frekvencie by som nezohľadnil. Naopak niekoho, kto by prišiel s odpoveďou že farmár, lebo vyššia apriórna pravdepodobnosť by som vnímal ako protivného chytráka, ktorý mi nechce zodpovedať jednoduchú otázku. Inak povedané odpoveď s pomocou apriórnych frekvencii nie je správnou odpoveďou, lebo otázku ľudia čítajú inak. Ľudia čítajú zadanie kauzálne – Štefanove osobnostné črty vedú k výberu zamestnania. Kauzálne interpretácie nám lepšie umožňujú interpretovať udalosti a úspornejšie ukladať vedomosti o nemenných pravidelnostiach v našom okolí. Ako píše Pearl (2009, s.182) “humans are generally oblivious to rates and proportions (which are transitory) and they constantly search for causal relations (which are invariant). Once people interpret proportions as causal relations, they continue to process those relations by causal calculus and not by the calculus of proportions.”

Bayesiánske siete útočia

Krynski & Tenenbaum (2007) ukázali, že ľudské posudky pravdepodobností je naozaj lepšie modelovať pomocou kauzálnych bayesiánskych sietí a la Pearl (2009). Podľa autorov ak sa ľudí spýtame na pravdepodobnosti ľudia neposudzujú aposteriórnu p(F|E) a p(K|E), ale pravdepodobnosť manipulácie, teda zmeny Štefanovho zamestnania. Dva scenáre a) “Štefan je knihovník” a b) “Štefan je farmár” vyjadrujú dva rôzne kauzálne grafy.

Probanti následne porovnajú pravdepodobnosť obidvoch grafov t.j. p(F,E,K) pre obidva modely. Pre graf a) p(F,E,K)=p(F)p(E)p(K|E) a pre graf b) p(F,E,K)=p(F|E)p(E)p(K). Ak členy prehádžeme zistíme, že graf a) – Štefan je knihovník je pravdepodobnejší ak aposteriórny pomer p(K|E)/p(F|E) > p(K)/p(F). Keďže popis výborne sedí na knihovníka, pravdepodobnosť, že popísaná osoba je knihovník je vyššia ako pravdepodobnosť, že náhodne vybraná osoba je knihovník, teda p(K|E)>p(K). V prípade že p(F|E) je rovné alebo dokonca menšie ako p(F) je graf a) pravdepodobnejší. Tento výpočet dobre zodpovedá našim intuíciám.

Zoberme si ďalší príklad z 15. kapitoly.

“Linda je 31 ročná, single, priamočiara a chytrá. Vyštudovala filozofiu. Ako študent sa zaujímala o problémy diskriminácie a sociálnu spravodlivosť a zúčastnila sa aj demonštrácii proti atómovej energii.”

Ktorá z nasledujúcich možností je pravdepodobnejšia?
a) Linda pracuje v banke.
b) Linda pracuje v banke a je členom feministického hnutia.

Väčšina ľudí vrátane mňa zvolí b). Pritom platí, že pravdepodobnosť zložených udalostí nemôže byť väčšia ako pravdepodobnosť jednoduchých udalostí. Logicky, počet ľudí, ktorí pracujú v banke a sú zároveň členmi feministického hnutia (BF) musí byť menší/rovný ako počet ľudí, ktorí pracujú v banke (B). BF je totiž podmnožina B. Tým pádom musí byť aj frekvencia a pravdepodobnosť udalosti b) nižšia ako a).

Intuitívne, čo ovplyvňuje naše nesprávne rozhodnutie je pravdepodobnosť že Linda je feministka v závislosti od popisu D, teda p(F|D). Tento popis totiž na feministku výborne sedí. Takisto výrok a) nám implikuje že Linda nie je členkou feministického hnutia lebo a) takto stojí v kontraste k b). Ľudia intepretujú otázku pravdepodobnejšej možnosti kauzálne a miesto aby porovnali p(BF|D) s p(B|D) porovnávajú pravdepodobnosť dvoch kauzálnych modelov p(M1) a p(M2), ktorých grafy vyzerajú nasledovne:

Pravdepodobnosti modelov sú znova dané ako zložená pravdepodobnosť všetkých premenných v modele p(F,D,B). Pre M1 platí p(M1)= p(F)p(D)p(B|D). Pre M2 platí p(M2)=p(F|D)p(D)p(B|D). Vidíme že aby sme porovnali pravdepodobnosť oboch modelov stačí nám porovnať p(F|D) a p(F). Ostatné členy sú rovnaké pre p(M1) a p(M2).  Apriórna pravdepodobnosť, že náhodne vybraná osoba je feministka p(F) je nízka. Oproti tomu, pravdepodobnosť že osoba s popisom D je feministka je vysoká, teda p(F|D)>p(F) a zvolíme b) presne ako nám intuícia káže. Kauzálnu analýzu možno predeklinovať na ostatné Kahnemanove príklady a zistíme, že k ľudským intuíciám sedí ako šerbeľ na zadok. Vyskúšajme si to.

Ktorá z alternatív je pravdepodobnejšia?

Linda má vlasy.

Linda má blond vlasy.

V tomto prípade sa ľudia nedopúšťajú omylu. Kahneman to vysvetluje tým že podobnosť popisu s feministkou má vysokú plauzibilitu/reprezentatívnosť, takže probanti ignorujú všetky ostatné informácie. Naproti tomu blond vlasy takúto vysokú plauzibilitu nezdieľajú. Linda môže byť kľudne aj bruneta. Obidva príklady pritom majú rovnakú logickú štruktúru. Príklady však nemajú rovnakú kauzálnu štruktúru. Grafy sú znázornené nižšie. B znamená “jej vlasy sú blond” a V “má vlasy”.

Trik je v tom, že V kauzálne ovplyvňuje B – a to veľmi silne, deterministicky. Ten, kto nemá vlasy nemôže mať blond vlasy. Tým sa mení štruktúra problému. Ak chceme porovnať M1 a M2 musíme porovnať p(B|V) a p(B|V,D). Toto porovnanie nie je ľahké keďže dodatočne závisí od V. Ak napríklad Linda nemá vlasy vieme, že nemá blond vlasy a teda p(M1)=p(B|V)=p(B|V,D)=p(M2).

Intuícia nám však hovorí že M1 je jednoznačne pravdepodobnejšie ako M2. Táto intuícia zodpovedá porovnaniu modelov M3 D \rightarrow V a M4 D \rightarrow B a platí p(V)>p(B).

Že v Kahnemanových príkladoch nejde o plauzibilitu/reprezentatívnosť možno ilustrovať pridaním šípky medzi Lindinimi feministickými záujmami a jej povolaním. Resp. táto šípka tam už je, avšak korelácia je negatívna – feministky najskôr nebudú pracovať v korporačnom kapitalistickom bankovom sektore. Môžeme si však upraviť príklad a Lindu zamestnať v kvetinárstve alebo v neziskovke a intuitívna pravdepodobnosť b) ku a) rapídne klesne. Pritom súvis medzi feminizmom a popisom zostal nezmenený, rovnako plauzibilný a teda podľa Kahnemana by sa ani hodnotenie nemalo meniť.

Problémom všetkých týchto Kahnemanových príkladov je že zatiaľčo pravdepodobnosti sú v zadaní dané, kauzálna štruktúra problému nie je určená. Tým pádom bayesiánske kauzálne modely netvoria jasné predpovede a nie je možné kauzálne modely jasne a priamo porovnať s Kahnemanovou teóriou. Krynski & Tenenbaum (2007) vo svojom štvrtom experimente manipulovali kauzálnu štruktúru zatiaľčo pravdepodobnosti ostali rovnaké. Príbeh k experimentu bol nasledovný.

S1: CIA zložila tím agentov. Misia vyžaduje nasadenie žien takže účasť žien v tíme je pravdepodobnejšia. Vskutku väčšina agentov v tíme sú ženy. Keďže ženy sú všeobecne nižšie, väčšina agentov v tíme je nižšia ako 170 centimetrov.

Q: Do tímu sa dostalo aj zopár mužov. Myslíte že títo budú nižší, rovnakí alebo vyšší ako priemerný muž?

Iná skupina probandov musela posúdiť Q na základe S2 :

S2: CIA zložila tím agentov. Misia vyžaduje nasadenie nízkych ľudí takže účasť nízkych ľudí v tíme je pravdepodobnejšia. Vskutku väčšina agentov sú nižší ako 170 cm. Keďže ženy sú všeobecne nižšie, väčšina agentov v tíme sú ženy.

Intuitívne odpovede sú S1 “rovnakí” a S2 “vyšší”, čo zodpovedá predpovediam kauzálnemu modelu. Pri S1 pritom ignorujeme informáciu že pravdepodobnosť člena tímu byť výšky nad/pod 170 cm je 50:50 a teda priemer je na mužský štandard skôr nízky. Z pohľadu kauzálneho modelu sa odpoveď mení lebo mechanizmus výberu agentov je iný. Z Kahnemanovho pohľadu sú S1 aj S2 rovnaké, keďže pravdepodobnosti sú rovnaké (a takisto oba príklady obsahujú rovnaké množstvo kauzálnej príbehovej omáčky). Tým pádom by aj odpovede probandov mali byť rovnaké. (Autori navyše prehodili aj otázky takže ďalšie dve skupiny posudzovali pravdepodobnosť pohlavia vysokých členov tímu. Výsledky boli opačné – S1 “skôr muži”, S2 “rovnakí”, tak ako kauzálny model predpovedá.)

Kahneman o kauzalite

Kahneman rozoberá vplyv kauzálneho úsudku na odpovede probantov v 16. kapitole. Kahneman súhlasí, že posudzovanie kauzality hrá rolu avšak jeho táto koncepcia je diametrálne odlišná od predstáv Tenenbauma a Pearla popísaných vyššie. Podľa Kahnemana sú probandi schopní správnej interpretácie štatistiky ak im ju zabalíme do kauzálneho príbehu. Podľa Tenenbauma kauzálny príbeh je nevyhnutnou súčasťou problému. Riešenie nie je definované ak nie je probandom daná kauzálna štruktúra. V úlohách vyššie probanti blahosklonne doplnia, čo experimentátor zo zadania vynechal. Väčšinou sa jedná o banálne kauzálne fakty – osobnosť spôsobuje výber povolania a nie naopak, minulosť ovplyvňuje budúcnosť a nie naopak… V prípade ak kauzálna štruktúra stojí v konflikte so štatistickou informáciou v inštrukcii (napríklad je dané p(K), ale kauzálny graf káže p(K|E)), tak probanti túto informáciu samozrejme ignorujú. Kauzálne vysvetlenie netvorí žiadnu nepodstatnú príbehovú omáčku, ktorej jediným cieľom je nakopnúť lenivý Systém 1. Kauzálna informácia je dôležitou súčasťou ľudských problémov bez ktorej tieto nie sú riešiteľné. Ako som citoval vyššie Pearla kauzálna interpretácia vedie k lepšiemu výberu dôležitých pravidelností, ktoré ostávajú konštantné. Tieto kauzálne pravidelnosti sa oplatí ľuďom zapamätať a komunikatívne šíriť. Preto aj naša komunikácia uprednostňuje kauzálnu interpretáciu. Keď kauzálna interpretácia vedie k zlým výsledkom, je to väčšinou v exotických prípadoch keď kauzálny súvis nie je očividný (napr. pri onkologických diagnózach) alebo v úlochách štatistikov a v experimentoch psychológov, ktorí si dôležitosti kauzálnej informácie nie sú vedomí.

Skryté súvislosti

Chcem ešte diskutovať zopár príkladov, kde nie je problematická kauzálna štruktúra ale štatistický model, ktorý Kahneman predpokladá ako normatív. V príklade na strane 160 probanti hodnotili dve sady produktov rovnakej kvality vo výpredaji. V sade A bolo 10 produktov, všetky bez chyby. V sade B bolo 10 bezchybných produktov + 2 poškodené produkty. Koľko ste ochotný zaplatiť za sadu A a koľko za sadu B? Vedci zistili že probanti sú ochotní zaplatiť viac za sadu A ak sú im ponuky predstavené jednotlivo. Ak im predstavia obidve ponuky bok po boku, tak probanti zvolia B. Kahneman poznamenáva, že štruktúra tohoto problému je podobná problémom uvedeným vyššie. Kahneman vychádza z toho že hodnoty sád h(A) a h(B) sú rovnaké nezávisle od spôsobu akým produkty predstavíme. Ak však postavíme produkty bok po boku musíme hodnotiť h(A|B) a h(B|A), teda hodnotu sady ak viem o ďalšej sade. Vskutku, zadanie implikuje h(A|B)<h(A).

Poznatok, že dva produkty sú poškodené vrhá zlé svetlo na kvalitu ostatných produktov v sade. Napríklad môžeme očakávať, že aj tieto obsahujú poškodenia v menšej miere a predajca nám ich zatajil, alebo môžeme predpokladať, že pravdepodobnosť, že sa produkt pokazí je vyššia (keďže dva sa pokazili ešte počas skladovania v obchode). Tak je tomu v prípade sady B predstavenej samostatne. Sada ktorá nedeklaruje pochybné produkty žiadne takéto podozrenie nevzbudzuje. To je prípad sady A predstavenej samostatne. Ak probanti vidia obidve ponuky vedľa seba a zadanie im hovorí že produkty v obidvoch sadách sú rovnakej kvality tak znalosť chybných produktov v sade B vrhá zlé svetlo nielen na produkty v sade B ale aj na produkty v sade A. Probanti tak pri tomto spôsobe prezentácie uprednostnia sadu B, ktorá ponúka oproti A vyššiu kvantitu nízkej kvality.

Druhý  príklad tvorí Kahnemanov experiment zo 16. kapitoly. Zadanie:

Taxík bol zapletený do nočnej dopravnej nehody a ušiel z miesta činu. Dve Taxi služby prevádzkujú v meste taxíky odlišnej farby – modré a zelené. 85% taxíkov je zelených a 15% je modrých. Svedok nehody identifikoval unikajúci taxík ako modrý. Súd testoval spoľahlivosť svedka a zistil, že svedok v 80% prípadov určil farbu taxíka správne a nesprávne v zvyšných 20% prípadov. Aká je pravdepodobnosť, že taxík zapletený do nehody bol skôr modrý ako zelený. (s. 166)

Probanti spáchajú intuitívny hriech – ignorujú nižší apriórny počet modrých taxíkov a v priemere odpovedajú 80%, čo zodpovedá spoľahlivosti svedka. Je však možné, že probanti vychádzajú z toho, že svedok je schopný zohľadniť apriórnu pravdepodobnosť taxíkov a teda že jeho úsudok je už očistený o tieto apriori poznatky. Vskutku v psychológii máme dobrú evidenciu, že vizuálne vnímanie ovplyvňujú top-down aj kognitívne faktory. V našom príklade (kľudne aj implicitná) znalosť relatívnej frekvencie zelených a modrých taxíkov môže viesť k tomu, že človek bude skôr halucinovať zelené taxíky. Krynski a Tenenbaum (2007) testovali túto hypotézu tým že upravili zadanie. Komplikujúci faktor netvorila nespoľahlivosť svedka ale fakt že 20% zelených taxíkov vyzeralo ako modré a 20% modrých ako zelené (dôvod: ošúchaná farba). V tomto prípade je svedok sto-percentne spoľahlivý a teda probanti musia dodatočne zvážiť aj apriórne frekvencie taxíkov. V tomto experimente probanti zohľadnili základné frekvencie modrých a zelených taxíkov.

Frekventistická štatistika ako normatívny štandard

Zopár Kahnemanových pozorovaní sa týka historických špecifík frekventistickej štatistiky – jej aplikácie a interpretácie. Tieto príklady skôr demonštrujú zlyhania frekventistickej štatistika ako zlyhania kognitívne. Kahneman sa v desiatej kapitole odvoláva na fakt, že psychológovia a vedci používajú moc malé vzorky vo svojich štúdiách – moc malé na to, aby získali signifikantné výsledky. Podľa Kahnemana sú na vine ich intuície a ani roky tréningu na tom nič nezmenili. Vtip je v tom, že psychológovia naozaj nechcú získať signifikantné výsledky. V psychológii súvisí všetko so všetkým a každý takýto efekt sa stane signifikantným pri dostatočne veľkej vzorke. Zároveň psychologické štúdie neštudujú jeden takýto efekt ale celú radu rôznych experimentálnych variácii s viacerými závislými a nezávislými premennými. Ak by psychológovia naozaj použili adekvátnu vzorku získali by neinterpretovateľnú armádu signifikantných efektov. S nízkou vzorkou získajú psychológovia len jeden, dva signifikantné efekty. Nesignifikantné výsledky sú interpretované ako žiadny rozdiel. Následne nie je ťažké k týmto dvom efektom vymyslieť teóriu, takže výsledky sú koherentné a publikovateľné (aj keď zrejme náhodné). Psychológovia teda veľmi dobre vedia čo robia, keď používajú neadekvátne vzorky. Malé vzorky tvoria optimálnu publikačnú stratégiu (Maxwell, 2004).

Kahneman sa ďalej odvoláva na štúdiu, kde testovali s Amosom Tverskym štatistické vedomosti členov americkej Society of Mathematical Psychology. Títo predviedli nechýrny výkon a dopustili sa viacerých omylov. Aj v tomto prípade si nemyslím, že na vine boli mylné intuície. Úlohy sa týkali hlavne frekventistickej štatistiky, ktorá je neintuitívna, mnohé jej koncepty sú nejasné a aj experti sa hádajú o ich interpretácii. Ďalším faktorom je týkajúcim sa konkrétne psychológov je, že výučba štatistiky v psychológii v 50.-80. rokoch zlyhala – viaceré učebnice šírili mylné koncepty a definície a viedli k nesprávnej aplikácii a interpretácii štatistických metód (Gigerenzer, 1992, 2004). Intuície v tomto zmätku zrejme hrali rolu. Môžeme však hovoriť o bayesiánskych intuíciách, ktoré síce vo frekventistickej štatistike nemajú miesto, avšak súčasný vzostup bayesiánskej štatistiky ich do veľkej miery validuje. Napríklad, Kahneman poukazuje na to, že sériu hodov mince HHHH vnímame ako menej pravdepodobnú ako HKKH. Technicky vzaté sú pri tom obidve série rovnako pravdepodobné s p = 2^{-7}. Ako ďalší príklad uvádza Kahneman miesto dopadov bômb na Londýn počas druhej svetovej vojny. Podľa viacerých vtedajších pozorovateľov tieto miesta vykazovali vzory a šetrili oblasti, kde boli umiestnení nemeckí špióni. Neskoršia štatistická analýza preukázala, že miestá dopadov bômb sú náhodné. Obidva tieto príklady diskutuje a testuje štúdia Griffithsa a Tenenbauma (2007), o ktorej som už písal na Mozgostrojoch. Aj v tomto prípade hrá kauzalita dôležitú rolu. V skratke, títo autori ukázali, že odhady pravdepodobností u probantov je lepšie interpretovať ako odhady kauzálnej náhodilosti, t.j. či známy kauzálny mechanizmus vplýva alebo nevplýva na pozorovania. Griffiths a Tenenbaum ukázali, že odpovede probantov zodpovedajú predpovediam bayesiánskeho modelu kauzálnej náhodilosti. Kauzalita je tradičným tabu vo frekventistickej štatistike a tak nečudo, že frekventistické modely nie sú schopné popísať odpovede ľudí.

Čo zostalo?

Vyššie som uviedol alternatívne vysvetlenia pre výsledky experimentov. Na výsledkoch experimentov to samozrejme nič nemení. Pozorované fenomény sú tie isté a prešli mnohými replikáciami. V prípade niektorých experimentov však nie je ich výpovedná hodnota zrejme taká vysoká ako sa Kahneman domnieva. Inštrukcia v týchto experimentoch nie je jednoznačná a umožňuje vplyv faktorov (t.j. apriórne kauzálne predstavy pomocou, ktorých probanti zadanie interpretujú), ktoré by dobrý experiment mal kontrolovať alebo aspoň merať.

Bayesiánske kauzálne modelovanie nič nemení na tom, že ľudia sa dopúšťajú spomínaných “chýb”. Akurát ukazujú, že zdrojom týchto chýb nie je v bias alebo nejaká nesprávna heuristika ale zlé zadanie problému. Alternatívne preto musíme najprv ujasniť ako chceme problém kauzálne modelovať a pokúsiť sa sprostredkovať túto kauzálnu štruktúru cieľovému publiku. Ak dochádza k nedorozumeniam treba ujasniť čí naše publikum problému pripísalo tú správnu štruktúru a ak nie, v ktorých aspektoch kauzálneho grafu sa reprezentácie líšia. Zatiaľčo Kahneman len vágne hovorí o kauzálnych schémach, reprezentatívnosti a plauzibilite (pojmy, ktoré fenomény skôr post-hoc označujú než vysvetľujú), kauzálny prístup umožňuje určiť v ktorých prípadoch vznikajú nedorozumenia a ako tieto nedorozumenia odstrániť.

Na záver treba dodať, že Kahneman uvádza aj príklady, kde sa s ním dá súhlasiť, že ide o zlyhania intuície. Konkrétne sa jedná o Gamblers Fallacy, regresia k priemeru a príbuzné situácie, kde je opakujúcim sa nezávislým javom pripisovaný kauzálny súvis. Kahneman uvádza príklad viery basketbalistov v existenciu horúcej ruky. Mnohí basketbalisti veria, že séria úspešných pokusov zvýšuje následnú úspešnosť hodov. Spoločnou súčasťou týchto príkladov je časová následnosť. Čas je silným zdrojom kauzálnej informácie, keďže vieme že minulosť je nezávislá od budúcnosti. Tým pádom ak sú dve časovo postupné udalosti korelované môžeme vylúčiť že budúca udalosť ovplyvňuje tú minulú a opačný mechanizmus sa nám ponúka ako vysoko plauzibilný. Uniká nám tým však možnosť že obidve udalosti nemusia byť sú podmienené priamo ale ich korelácia môže byť sprostredkovaná tretím faktorom. Pearl (2009) diskutuje tieto prípady. Aj keď uznáva že prílišná ochota uvidieť kauzalitu môže viesť pri nezávislých časovo následných udalostiach k ilúziám, aj v pri týchto iluzórnych prípadoch môžeme nájsť dobré dôvody prečo zariskovať. Minulé hody mince nám nepovedia nič o pravdepodobnosti tých budúcich. Uváženie tejto kauzálneho súvisu nám môže pomôcť zistiť či minca nie je upravená, alebo naopak nám môže vnuknúť nápad mincu upraviť a využiť túto znalosť vo svoj prospech [Edit 1/4/2013: doplňujem citát]:

It is the nature of any causal explanation that its utility be proven not over standard situations but rather over novel settings that require innovative manipulations of the standards. The utility of understanding how television works comes not from turning the knobs correctly but from the ability to repair a TV set when it breaks down. Every causal model advertises not one but rather a host of submodels, each created by violating some laws. The autonomy of the mechanisms in a causal model thus stands for an open invitation to remove or replace those mechanisms, and it is only natural that the explanatory value of sentences be judged by how well they predict the ramifications of such replacements. (s. 220)

Na LessWrong písali, že filozofi by mali študovať Kahnemana a Pearla namiesto Kanta a Platóna. Ja môžem len dodať, že (aspoň čo sa týka teoretizovania) psychológovia by mali študovať Pearla namiesto Kahnemana. Hierarchia vied nepustí.

Literatúra
Gigerenzer, G. (1992). The superego, the ego, and the id in statistical reasoning. A handbook for data analysis in the behavioral sciences: Methodological issues, 311-339.
Gigerenzer, G. (2004). Mindless statistics. Journal of Socio-Economics, 33(5), 587-606.
Griffiths, T. L., & Tenenbaum, J. B. (2007). From mere coincidences to meaningful discoveries. Cognition, 103, 180-226.
Kahneman, D. (2011). Thinking, fast and slow. Farrar, Straus and Giroux.
Krynski, T. R., & Tenenbaum, J. B. (2007). The role of causality in judgment under uncertainty. Journal of Experimental Psychology General, 136(3), 430.
Maxwell, S. E. (2004). The persistence of underpowered studies in psychological research: causes, consequences, and remedies. Psychological methods, 9(2), 147.
Pearl, J. (2009). Causality: models, reasoning and inference (2nd ed.). Cambridge University Press. Cambridge, UK.

Judea Pearl: Causality (Časť 3)

Zatiaľčo druhá a tretia kapitola tvoria teoretické mäso, štvrtá až šiesta kapitola tvoria aplikáciu a diskusiu. Štvrtá kapitola sa zaoberá zovšeobecneným Pearlovho do(X=x) formalizmu. Pearl ukazuje ako vyhodnotiť viaceré manipulácie P(Y|do(X_1=x_1),\dots, do(X_n=x_n)) . Takúto viacnásobnú manipuláciu môžeme nazvať intervenčný plánom. Moc nového sa však nedozvieme. Tieto plány možno vyhodnotiť pomocou intervenčného kalkulu z tretej kapitoly. Jedinou dodatočnou komplikáciou je že si musíme dať pozor v akom poradí transformujeme do(X_i=x_i) na X_i=x_i. Nie všetky sekvencie musia viesť k riešeniu. Aby sme zistili, či je efekt identifikovateľný musíme prešetriť všetky možné sekvencie. Pearl ukazuje ako toto šetrenie zjednodušiť a urýchliť.

Ďalšie zovšeobecnenie umožňuje rozšírenie manipulácie na ľubovoľné funkcie P(Y|do(X=g(z)), kde g(z) je funkciou ostatných premenných v grafe. Aj v tomto prípade výsledky z tretej kapitoly platia. Akurát si musíme dať pozor ktoré premenné zahrnemie do z, tak aby efekt intervencii zostal identifikovateľný.

Piata kapitola diskutuje modelovanie pomocou štrukturálny rovníc (SEM), ktoré je populárne hlavne v sociálny vedách. Predchádzajúce kapitoly vychádzali zo všeobecného prípadu a výsledky platia pre ľubovoľný model x_i = f_i(pa_i,\eta_i). T.j. každá premenná je funkciou hodnôt svojich rodičov pa_i a náhodného faktora \eta_i. Štrukturálne modely špecifikujú lineárny vzťah: x_i = \sum_{k \not = i} \alpha_{ik}x_k + \eta_i , kde \eta_i sú navzájom nezávislé náhodné premenné a \alpha_{ik} tvoria neznáme koeficienty.

V zásade všetky výsledky popísané v predchádzajúcich kapitolách platia aj pre SEM, poprípade sa dajú vďaka lineárnej formulácii zjednodušiť. Pearlova diskusia sa točí hlavne okolo interpretácie ktorej sa SEM historicky dostalo od štatistikov, epidemiológov a sociálnych vedcov. Pre Pearla sú štrukturálne rovnice ekvivalentnou reprezentáciou ako grafy. Vyjadrujú rovnakú t.j. kauzálnu informáciu. Konkrétne \alpha_{ik} vyjadrujú o koľko sa v priemere zmení x_i ak manipulatívne zmeníme x_k o jednu jednotku. Táto intepretácia uniká štatistikom, keďže nemajú jasnú definíciu kauzality. Štatistici tak interpretujú štrukturálne rovnice ako regresiu kde \alpha_{ik} tvoria regresné koeficienty a \eta_i je reziduálna odchýlka. V takto vnímaných rovniciach možno presúvať členy z ľavej na pravú stranu od rovnítka, čo vedie k problémom. Použitie rovnítkovej notácie tak trochu zavádza. Rovnítko vyjadruje jednosmerné kauzálne priradenie príčina k efektom a členy nemožno presúvať.

Zaujímavé je v kontexte SEM sa pozrieť na fyzikálne zákony, napr. Ohmov zákon: I=V/R, kde I je prúd, V napätie a R vyjadruje odpor vodiča. Tieto zákony možno interpretovať ako štrukturálne rovnice. Vidíme, že vo fyzikálnych zákonoch chýba stochastický člen \eta. Model je deterministický a nepredpokladá prítomnosť žiadnych ďalších faktorov. Ohmov zákon možno interpretovať kauzálne – pridaním napätia spôsobíme vyšší prietok elektrického prúdu vodičom. V tomto zmysle možno 1/R interpretovať ako koeficient \alpha. Z pohľadu fyziky nie je problém prehodiť členy z ľavej na pravú stranu a naopak. Napríklad môžeme získať R= V/I. Z pohľadu kauzálnej interpretácie je však takáto úprava neprípustná. Rovnica by vyjadrovala, že pridaním prúdu (pri konštantnom napätí) môžeme zmeniť odpor vodiča, čo je zjavne nezmysel. Čiže aj keď fyzici manipulujú rovnice, nie všetky výsledné formulácie sú si rovné. Nie všetky sú kauzálne interpretovateľné.

Kauzálna interpretácia fyzikálnych zákonov nás nevyhnutne vedie k otázke definície systému. Ak sa pozrieme na vesmír ako uzavretý celok, tento nepripúšťa žiadne alternatívne udalosti. Fyzikálny vesmír tvorí deterministický stroj, ktorého dianie je nevyhnutne dané jeho počiatočným stavom. Z tohoto pohľadu nedáva ani pojem kauzality zmysel. Žiadne manipulácie nie sú možné a žiadne alternatívy neexistujú. Kauzálne interpretácie začnú byť zmysluplné ak z vesmíru vystrihneme určitý výsek – ak definujeme systém, ktorý chceme skúmať. V tomto ohľade sa Pearlove predstavy veľmi podobajú na úvahy o kauzalite u Norberta Bischofa, ku ktorým sa snáď niekedy vrátim (niečo už bolo spomenuté tu).  Všeobecne, definícia systému znamená vymedzenie jeho hraníc. Tým má zmysel uvažovať o externej manipulácii. Zákony a štrukturálne rovnice nám umožňujú kompaktne popísať ako takéto manipulácie ovplyvnia fungovanie systému.

Ako som spomenul piata a šiesta kapitola sa zaoberajú z veľkej časti kontroverziami a paradoxami, ku ktorým dochádza ak výskumník nie je vyzbrojený formálnou definíciou kauzality. Neznalí môžu opomenúť tieto diskusie ako historické kontroverzie. Snáď ešte ako tak zaujímavé sú formálne definície niektorých konceptov, o ktorých experimentátori bežne hovoria a uvažujú. Pomocou Pearlových formalizmov, môžeme vyjadriť pravdepodobnosť priameho efektu, vedľajšieho efektu a celkového efektu. Priamy efekt tvorí v grafe šípka z X do Y. Celkový efekt tvoria všetky cesty z X do Y a vedľajší efekt tvorí celkový efekt mínus priamy efekt (teda všetky vedľajšie cesty). Prečo rozlišovanie týchto efektov dáva zmysel si môžeme spriehľadniť na nasledujúcom príklade. Ak chceme zistiť či sú ženy pri pohovoroch (napr. prijímačky na vysokú školu) diskriminované na základe pohlavia, nestačí nám zistiť či je úspešnosť žien na pohovoroch nižšia ako úspešnosť mužských uchádzačov. Je možné, že muži sú kompetentnejší a výberové konanie tieto kompetencie zohľadňuje. Kompetencie uchádzačov, ktoré korelujú s pohlavím a aj s úspešnosťou uchádzača tak môžu spôsobiť koreláciu medzi pohlavím a úspešnosťou. V tomto prípade hovoríme o vedľajšom efekte. Na výbere kompetentných uchádzačov nie je nič zlé, práve naopak. Ak sa pýtame na existenciu diskriminácie zaujíma nás priamy efekt pohlavia na úspešnosť a vedľajšie efekty chceme ignorovať. T.j. pýtame sa aký efekt by mala zmena pohlavia na úspešnosť ak by sme všetky ostatné premenné držali na konštantnej úrovni. Pearlov formalizmus umožňuje posúdiť silu týchto efektov na základe pozorovaní bez nutnosti manipulácie.

Že by vyššie uvedená úloha mohla byť riešiteľná len na základe pozorovaní, sa zdá uletené. Ako držať konštantné všetky faktory? Ktoré sú to faktory? A na akej úrovni ich chceme držať konštantné? Východiskom výpočtov je samozrejme naša znalosť kauzálnej štruktúry problému. Našťastie nemusíme poznať všetky faktory. Stačí nám poznať rodičov príčiny X, teda faktory ktoré majú priamy vplyv na pohlavie uchádzačov a kontrolovať tieto.

Otázka hodnôt kontrolovaných faktorov ostáva na výbere vedca. Pearl poznamenáva, že zaujímavou voľbou je zvoliť hodnoty, ktoré by nadobudli tieto faktory ak by sme zvolenú hodnotu príčiny pozorovali (a nie manipulovali). Pearl hovorí o prirodzenom priamom efekte, ktorý možno formálne vyjadriť ako

\sum_z ( E(Y| do(x',z))- E(Y|do(x,z)) )P(z|do(x))

kde E(Y) je očakávaná hodnota efektu, x je pozorovaná hodnota a x' je manipulovaná hodnota príčiny. Intuitívne, prirodzený priamy efekt vyjadruje výsledky experimentu, v ktorom by uchádzači zmenili pohlavie a všetky ostatné faktory – vek, kompetencie, CV, priebeh pohovoru etc. ostali rovnaké. Takýto experiment nie je možné vykonať. Že je možné inferovať výsledky tohoto experimentu na základe pozorovaní bežných pohovorov je podľa mňa absolútne úžasné!

Judea Pearl: Causality (Časť 2)

Druhá kapitola sa zaoberala najťažším prípadom inferencie, keď máme dané len rozdelenie pravdepodobnosti. V tretej kapitole poznáme okrem pravdepodobností aj graf, teda kauzálnu štruktúru problému. Vďaka tejto znalosti môžeme posúdiť vplyv manipulácii na pozorované pravdepodobnosti. V tretej kapitole sa Pearl zaoberá elementárnymi manipuláciami, ktoré zvonku určia hodnotu určitej premennej a snažia sa zistiť následky. Vo štvrtej kapitole potom Pearl rozoborá komplikovanejšie reťaze manipulácii a reaktívnych stratégii, kde manipulácia závisí pozorovaných hodnôt iných premenných.

Formálne predstavuje manipulácia premennej A dosadenie určitej hodnoty nezávisle od rodičov A v grafe. V grafe vyššie, ak chceme pozorovať kauzálny efekt manipulácie A=a na premennú B musíme zmeniť A na pozorovanú premennú s hodnotou a. To znamená, že musíme odstrániť všetky šípky smerujúce do A. A je externe manipulované a tým pádom nezávislé od svojich rodičov v grafe. Výsledný graf je znázornený vpravo. Pre oba grafy môžeme vypočítať P(A,B,C,D1,D2,D3) a porovnaním pravdepodobností zistiť efekt manipulácie na na P(B). Pearl označuje toto rozdelenie ako P(B| do(A=a)) , kde do(A=a) vyjadruje úpravu grafu. Konkrétne platí

P(b|do(A=a)) = \sum_{pa} P(b|a,pa) P(pa)

, kde pa je množina rodičov. Intuitívne, ak máme pozorovania fungovania v grafe vľavo a chceme zistiť ako by ovplyvnilo A=a premennú B, tak sa pozrieme na prípady, keď A (zhodou okolností) nadobudlo túto hodnotu a a pýtame sa, čo sa vtedy stalo s B. Problémom sú tretie premenné, ktoré vplývajú na A a aj na B. Vplyv týchto premenných anulujeme tým, že P(b|a) vážime v závislosti od rodičov A. Rovnicu vyššie možno interpretovať ako vážený priemer.

Samozrejme podmienkou vyššie uvedeného výpočtu je, že vplyv rodičov poznáme. Pripomínam, že je daný graf a pozorovania. Pozorovania však nemusia zahŕňať všetky premenné definované v grafe. Musíme sa preto pýtať ktoré premenné musíme pozorovať, aby sme vedeli určiť kauzálny súvis. Pearl ponúka viacero grafických kritérii, ktoré poslúžia ako rýchle heuristiky. Podľa kritéria únikových dverí musia byť všetky únikové cesty (teda šípky smerujúce do A) z A do B blokované množinou pozorovaných premenných D.

Možno trochu prekvapivo bezhlavé pridávanie kontrolných D nemusí byť prospešné pre analýzu. Pridanie premenných,ktoré sú potomkami A totiž môže odblokovať únikové cesty. V grafe nižšie chcem určiť vplyv liečby (L) na chorobu (Ch). Ak zahrniem bolesť hlavy (H), ktorú liečba spôsobuje ako kontrolnú premennú do analýzy tak si spôsobím problém. Keďže gény (G) okrem choroby ovplyvňujú aj bolesť hlavy vznikne medzi chorobou a liečbou nepravý súvis, sprostredkovaný novou vedľajšou cestou v grafe cez bolesť hlavy a gény. Keďže H tvorí strediska, táto cesta je odblokovaná práve v prípade keď je H pozorované.

Okrem kritéria únikových ciest ponúka Pearl ďalšie. Všeobecne možno určiť P(b|do(A=a)) a vskutku P(b|do(A_1=a_1), \dots , do(A_n=a_n)) pre ľubovôlnú množinu manipulácii premenných A_1, \dots, A_n pomocou takzvaného intervenčného kalkulusu. Tento poskytuje pravidlá ako na základe grafu a pozorovaných nezávislostí pretaviť výrazy s vokáňom do výrazov bez neho. Jeho aplikácia je komplikovanejšia. Grafické kritéria (napr. kritérium únikových ciest) sú na druhej strane jednoduchšie ako keby sme sa mali prebíjať aritmetikou. Kalkulus garantuje nájdenie riešenia ak takéto existuje a zároveň ak riešenie neexistuje (kvôli prítomnosti konfundujúcich premenných) zistíme, že tomu tak je. V druhom vydaní Pearlovej knihy pribudlo aj všeobecné grafické kritérium, ako zistiť či efekt manipulácie možno vypočítať. Toto hovorí, že neexistuje žiadna latentná premenná spájajúca uzol A s jeho deťmi. V tomto prípade možno P(b|do(A=a)) určiť.

Asi najväčším prekvapením tejto kapitoly pre mňa bolo, že pridávanie kontrolných premenných môže byť kontraproduktívne pre zistenie kauzálnych príčin. V psychológii mnohokrát kontrolujeme a balancujeme, čo sa dá. V psychológii zároveň kauzálny graf prakticky nikdy nepoznáme. Akurát vieme, že všetko súvisí so všetkým a za každým rohom sa skrýva latentná príčina. V tomto prípade asi najlepšou taktikou je naozaj kontrolovať a balancovať experiment. Zároveň si ale musíme byť vedomí ťažkostí, ktoré toto môže privodiť. Pearlove formalizmy umožňujú spoľahlivo identifikovať premenné vhodné pre kontrolu a manipuláciu.

Judea Pearl: Causality (Časť 1)

Jaynesovu knihu som úž dávnejšie dočítal. Súhrny pre Mozgostroje som zatiaľ vynechal. Chcem tieto kapitoly prečítať pozorne ešte druhý krát a poprípade konfrontovať ďalšie zdroje. Súhrny zvyšných (13) kapitol sa teda objavia niekedy v budúcnosti. Ako hodnotného Jaynesovho nástupcu som už medzičasom vybral Pearlovu knihu o kauzalite. Kniha spĺňa prvé Matúšovo kritérium čitateľnosti v tom, že si bere filozofov na paškál (a ešte viac vo svojej druhej edičnej inkarnácii). V recenziách na amazone sa môžete napríklad dozvedieť od filozofa vedy: “The second edition repeats the first edition verbatim, but at the end of most chapters there’s a clearly defined section dealing with subsequent developments. There’s a long chapter at the end that updates you on the replies to the first edition, and some helpful new material explaining things that were tricky the first time through. The updates are concise. Replies to philosophers (at least) are ultimately devastating, although Pearl could explain himself more fully.”Takisto na LessWrong navrhli nahradiť Platóna Pearlom vo filozofickom učebnom curriculu.

V určitom zmysle Pearlova monografia pokračuje, kde tá Jaynesova skončila. Chápanie teórie pravdepodobnosti ako rozšírenej logiky umožňuje jasne definovať mnohé koncepty, ktoré tradičnej štatistike unikajú. Jedným takýmto konceptom je kauzalita.

Je možné dospieť na základ pozorovaní, že A je príčinou pre B? Aký postup zvoliť? Je možné tento postup formalizovať a automatizovať? Tradičná štatistika pozná koncepty ako korelácia, kovariancia, nezávislosť dvoch premenných alebo konfundujúca premenná. Kauzalita však ostala pre štatistiku tabu. Väčšinou sa o nej dozviete len z varovaní a negatívnych výrokov o tom, čo pomocou štatistických konceptov nie je možné zistiť. Najznámejšia mantra hovorí, že korelácia neimplikuje kauzalitu – cum hoc, propter hoc. V následujúcom hurhaji okolo akademického upaľovania previnilca, však zanikne otázka, čo teda kauzalitu implikuje. Kauzalita, tak ako ostatné predstavy vyhodené na smetisko vedy ostala napospas filozofom.

Pearl je špecialistom na kauzalitu. Počas svojej akademickej kariéry navrhol spektrum metód a stratégii, ktoré riešia rôzne problémy vznikajúce pri analýzach kauzality. Pearl sa nezľakol kontroverzii a tabu spojených s inferenciou kauzality. Jeho dôležitým postrehom bolo, že ľudia inferujú kauzalitu celý čas a väčšinou sú v tom prekvapujúco úspešný. Pearlovými hlavnými nástrojmi je teória pravdepodobnosti, teória grafov a topológie. Jeho výskum tak spadá metodicky do oblasti AI a učenia strojov aj keď jeho implikácie a aplikácie sa týkajú prevažne štatisticky a filozofie. Jeho kniha Causality (Pearl, 2009) tvorí súhrn tohoto výskumu. Kniha nie je ľahké čítanie. Nie je to dané tým, že používa moc technický jazyk, alebo že by bola samotná téma veľmi zložitá. Matematika je jednoduchá avšak obsah knihy je silne našlapaný. Diskusia je obmedzená na minimum. Kapitoly sú vystavané na definíciách, teórémach, algoritmoch a poprípade ich dôkazoch a príkladoch aplikácie. Obsah je dobre štrukturovaný a vysvetlený. Je však natlačený, takže občas sa cítim už po piatich stranách vysilený a nepamätám si všetky definície takže musím listovať a vracať sa naspäť. Inak ide o nanájvyš zaujímavé čítanie, tak ako téma sľubuje.

Kauzalitou sa možno zaoberať v rôznych situáciách. V tomto článku sa obmedzím na situáciu, keď sú dané len pozorovania a nie je možné premenné experimentálne manipulovať. Pearl sa touto situáciou zaoberá v druhej kapitole. Inferencia v takýchto situáciách nie je nemožná. Akurát sme, podobne ako fyzici čakajúci na výbuch supernovy, odkázaný na priazeň prírody a výskyt prírodných experimentov, ktoré táto svojim vedeckým divákom ponúkne.

V tomto prípade nám ako formalizmus pre určenie kauzality postačia bayesiánske grafické modely, ktoré som už na tomto blogu predstavil. Videli sme, že grafický model vyjadruje podmienené súvislosti, ktoré určujú kauzálny vplyv.

Uzly reprezentujú udalosti/výroky/premenné a šípky znázorňujú podmienenosť. Z grafu je možné vyčítať pravdepodobnosť elementárnych situácii. Každý uzol prispeje jedným členom v multiplikácii p(M,P,D)=p(P)p(M|P)p(D|M,P). Z tejto pravdepodobnosti môžeme získať pomocou p(A)=\sum_Bp(A|B)p(B) a definície podmienenej pravdepodobnosti všetky ostatné pravdepodobnosti. Z grafu je takisto možné vyčítať  nezávislosť udalostí.

Nezávislosť je komplikovanejší koncept ako podmienenosť. Napríklad v grafe A \rightarrow C \rightarrow B síce neexistuje priamy šíp od A ku B avšak A podmieňuje B prostredníctvom C.  Následujúce pravidlo umožňuje určiť nezávislosť premenných v grafe: A a B sú navzájom nezávislé pre danú (pozorovanú) množinu premenných C (A \perp B | C ) ak všetky cesty v grafe medzi A a B obsahujú aspoň jeden z nasledujúcich prípadov.

1. Jednosmerka: a \rightarrow \dots \rightarrow c \rightarrow \dots \rightarrow b (tri bodky ilustrujú prítomnosť ďalší premenných, ich prítomnosť je však nepodstatná a v ďalšej diskusie ich vynechám) a uzol c je v množine C. Intuícia je nasledovná. Ak vysoký obsah vápnika (V) vo vode spôsobuje vodný kameň (K) a vodný kameň spôsobuje hučanie variča (H), tak hučanie variča je nezávislé od obsahu vápnika ak viem, že varič je zanesený vodným kameňom (V \perp H | K ) . Ako sme videli u Jaynesa nezávislosť vyjadruje informačnú nezávislosť. V našom príklade vyjadruje, že znalosť V nám nepovie nič nové o hučaní H ak vieme K – že varič je zanesený (alebo nie je zanesený). Ak by sme K nepoznali, množina C by bola prázdna a v tomto prípade by bolo H závislé od V. Smerovanie jednosmerky pritom nie je dôležité, keďže na poradí argumentov nezáleží A \perp B|C=B \perp A|C.

2. Rozchodník (spoločná príčina): a \leftarrow c \rightarrow b a c je v C. Podobne ako pri 1, ak poznám príčinu, znalosť a mi nepovie nič nové o b.

3. Stredisko (spoločný následok): a \rightarrow c \leftarrow b a c nie je v C. Kľúč od trezora majú len Anton a Boris. Ak viem, že niekto otvoril trezor (C) a dozviem sa, že to určite nebol Anton (A), tak automaticky viem, že ho otvoril Boris (B). Znalosť A nám teda povedala niečo o B ak zároveň poznáme C. Teda A a B sú závislé ak poznáme C. Možno trochu prekvapivo ak C nepoznáme, tak nemôžeme s istotou nič tvrdiť o B na základe A a tieto sú nezávislé.

Ak je množina C prázdna a A a B sú nezávislé hovoríme o nepodmienenej nezávislosti, v opačnom prípade o podmienenej.

Grafické modely (GM) sú abstraktnou reprezentáciou. Abstraktnejšou ako probabilistický model, ktorý je plne definovaný až keď určíme jeho parametrizáciu (na základe dát). a \rightarrow b teda pretavíme napríklad do b \sim \mathcal{N} (a,\sigma=2) a všeobecne pre každý uzol určíme funkčný vzťah x = f(pa_x). Kde pa_x sú rodičia x, teda premenné z ktorých smeruje šíp do x. Túto konkrétnejšiu reprezentáciu nazýva Pearl kauzálnym modelom, zatiaľčo v prípade GM hovorí o kauzálnej štruktúre.

Samozrejme v praxi graf nepoznáme. Poznáme dáta, prostredníctvom ktorých môžeme odhadnúť rozdelenie pravdepodobnosti. Preto nás zaujíma vzťah medzi pravdepodobnosťami (model) a grafickou reprezentáciou (štruktúra). Dôležitú rolu pritom hrajú nezávislostí v grafe. Nezávislosť premenných je možné identifikovať cez testovanie signifikantnosti. V prípade nezávislosti totiž platí p(A,B)=p(A)p(B) a môžeme testovať či sa náš odhad p(A,B) signifikantne líši od produktu p(A)p(B).

Vo všeobecnosti nemožno jednoznačne identifikovať na základe pravdepodobnosti graf, ktorý rozdelenie vygeneroval. Napríklad ak prešetríme na nezávislosť grafy A \rightarrow B \rightarrow C a A \leftarrow B \leftarrow C zistíme, že obidva vykazujú rovnaké nezávislosti. B a A sú nezávislé pre pozorované C. Všetky ostatné konfigurácie sú závislé. Z pravdepodobností preto môžeme vyčítať, čo Pearl nazýva vzor – graf ktorý je miešanina smerovaných šípov a spojení bez orientácie. Spojenia bez orientácie pritom vyjadrujú neistotu ohľadom smerovania a teda, že pri danom spojení sú obidva smery možné. Vzor získame pomocou nasledujúceho algoritmu.

V prvom kroku prešetríme všetky páry uzlov A,B. Ak sú A,B závislé pre všetky možné množiny C tak pridáme spojenie medzi A a B.

Vyššie sme videli, že pre jednosmerky nie je možné jednoznačne určiť smerovanie. To isté platí pre rozchodník. Situácia je iná pri stredisku. Strediská je možné identifikovať v grafe na základe nezávislostí. Ak sme v prvom kroku získali spojenie medzi A-C a medzi B-C a A,B sú nezávislé (žiadne spojenie), tejto konfigurácii zodpovedá len A \rightarrow C \leftarrow B. Pre každú inú orientáciu by museli byť A a B závislé.

Následne v treťom kroku sa snažíme nájsť orientáciu pre čo najviac zostávajúcich spojení. Pri tom využívame dva fakty. Po prvé, definícia vyžaduje aby bol graf acyklický. Pri konfiguráciách kde existuje len jediná acyklická alternatívna orientácia, túto musíme zvoliť. Po druhé, druhý krok vyčerpávajúco určuje strediská, preto žiadne ďalšie strediská nemôžeme do grafu pridať. Znova, pri konfiguráciách, kde existuje ku strediskám jediná alternatíva, zvolíme práve túto.

Tento algoritmus predpokladá, že všetky uzly sú pozorované. Situácia sa komplikuje ak povolíme prítomnosť nepozorovaných latentných premenných v našom modeli. V tomto prípade nie je možné jednoznačne určiť ani vzor definovaný vyššie. Napríklad graf MPD znázornený vyššie je schopný vygenerovať každé rozdelenie pravdepodobnosti vygenerované grafom M \rightarrow P  (Presnejšie pre každú parametrizáciu MP existuje parametrizácia MPD ktorá produkuje rovnaké rozdelenie pravdepodobnosti MP). Dôvod je evidentný – graf MPD zahŕňa MP. Riešenie je rovnako evidentné. S odvolaním sa na Ockhamovu britvu uprednostníme štruktúru s minimálnym počtom závislostí t.j. hrán v grafe. Následne môžeme upraviť algoritmus popísaný vyššie tak, že nám určí minimálny vzor s latentnými premennými. Pearl navrhol špeciálny vzor, ktorý reprezentuje latentné premenné ako hrany. Množinu uzlov tvoria pozorované premenné. Nasledujúce hrany sú možné. Skutočné príčiny A na B znázorňujú hrany A \rightarrow B . Nepravá súvislosť A \leftrightarrow B vyjadruje spoločnú latentnú príčinu A \leftarrow L \rightarrow B. Potenciálne príčiny  A \rightarrow^* B nechávajú dve vyššie uvedené možnosti otvorené. Buď ide o potenciálnu príčinu alebo nepravú súvislosť.

Konkrétny algoritmus na tomto mieste vynechám. Zaujímavé je jeho fungovanie v zredukovanom prípade, keď máme informáciu o časovom slede udalostí, teda o časovej organizácii premenných. V prípade časovej postupnosti totiž vieme, že budúce udalosti nemôžu mať vplyv na minulé udalosti. V tomto prípade sú všetky minulé udalosti potenciálnou príčinou pre všetky budúce udalosti. Vskutku definícia potenciálnej príčiny umožňujú formalizovať koncept štatistického času. Takýchto zoradení je v každom grafe viacej. Pearl vyjadril domnienku, že aspoň jeden zo štatistických časov bude zodpovedať tomu fyzikálnemu. Pearl však zároveň ukazuje že koncept času závisí od reprezentácie premenných a je možné nájsť ku každej reprezentácii, reprezentáciu, v ktorej funguje kauzalita opačne – z budúcnosti do minulosti. Otázku definície času, tak možno zredukovať na otázku definície problému. Bolo by napríklad zaujímavé vypracovať alternatívnu reprezentáciu pre štandardný model časticovej fyzike, kde čas beží opačne a uistiť sa, že táto reprezentácia je menej parsimónna.

Čo sa týka skutočných príčin, tieto okrem toho, že sú potenciálnymi príčinami, musia spĺňať dodatočnú podmienku, že ak má byť B príčinou C tak musí existovať (v čase predchádzajúca) premenná A pre ktorú platí  A \not \perp C a A \perp C| B. Inak povedané ak je B príčina C tak B zablokuje tok informácii od A ku C.

Nakoniec pre nepravý súvis platí že existuje predchádzajúce A, tak že A \not \perp B a A \perp C . Túto konfiguráciu možno vysvetliť tým, že A je spoločnou príčinou B \leftarrow A \rightarrow C a B nemá ďalší vplyv na C aj keď mu predchádza v čase. Inak povedané súvis medzi A a B existuje len v dôsledku tretej premennej a je preto nepravý.

Zhrniem. Rozdelenie pravdepodobnosti pozorovaných premenných samo o sebe neumožňuje určiť kauzálny súvis. Na to potrebujeme grafickú reprezentáciu bayesiánskych grafických modelov. Ak ju nepoznáme, čiastočne ju môžeme vypočítať z pozorovaných pravdepodobností. Pearl ukazuje ako. Komplikáciou je potenciálna prítomnosť neznámych latentných premenných v grafe. Naopak znalosť časovej postupnosti značne zjednodušuje inferenciu grafu a kauzality.

Pearl, J. (2009). Causality: models, reasoning and inference (2nd ed.). Cambridge University Press. Cambridge, UK.

Formálny model inferencie: Prípad časticovej fyziky

Mnohí vedci robia svoju prácu s nadšením, ktoré by bolo často možné aj klinicky diagnostikovať. Keď sa ich spýtate na predmet ich výskumu môže sa vám dostať výlevu aký by ste očakávali od básnika, ktorý sa po fľaši vína rozhovorí o svojich múzach. Napríklad z rozhovoru Weinberga pre nemecký Spiegel (môj preklad):

SPIEGEL: Keď vy alebo iný fyzici začnete hovoriť o teórii všetkého tak skôr, či neskôr padne slovo “krása”. Ako môže byť teória krásna?

Weinberg: V určitom zmysle sa to dá porovnať s pojmom krásy v hudbe: Ak počúvate Prelude od Chopina, tak cítite, že každý tón je správne zvolený. Žiadny iný by ho lepšie nenahradil.

SPIEGEL: Objektívna veda sa spolieha na subjektívne pocity?

Weinberg: Vskutku dokážeme vycítiť ak naše teórie obsahujú nejaký falošný tón. Samozrejme nie vždy sa v tom zhodneme. Následne sa sporíme tak ako sa ľudia sporia o tom či hudobnú skladbu možno vylepšiť. Ale v konečnom dôsledku je to jeho/jej nenahraditeľnosť, čo konkrétny tón alebo rovnicu robí krásnou. Keď počujete melódiu, ako opakuje frázu, tak cítite: Toto nemožno vylepšiť.

SPIEGEL: Hudba nepozná žiadne objektívne merítko, pomocou ktorého by sme mohli rozhodnúť, či je Mozartova hudba krajšia ako Chopinova alebo Schönbergova. Vo vašej vede však niečo také snáď existuje, či nie?

Weinberg: Testujeme teórie aby sme zistili či sú konzistentné s experimentami. Tým testujeme náš cit pre krásu – testujeme či sú naše teórie pravdivé. Pravda je niečo, k čomu v umení neexistuje žiadna paralela. V umení je otázka pravdivosti bezvýznamná.

SPIEGEL: Je pravda krásna?

Weinberg: Áno.

Podobné ódy na vedu možno nájsť u ďalších jej popularizátorov. Paradoxným vedľajším produktom je, že vedecký proces – proces vymýšľania teórii a experimentov alebo analýzy dát je vnímaní vedcami so spirituálnou bázňou. Čiže naturalizácia estetiky alebo naturalizácia náboženstva a spirituality sú v poriadku. No skúste vedcom navrhnúť, aby konečné postavili silikónového vedca a  proces naturalizácie narazí na odpor. Vedci, ich neobmedzená kreativita a intuícia pre krásu, sú predsa nenahraditeľní. Zrazu ani posledný dualistický kruhový argument nie je dosť zlý na to, aby vedci pomocou neho uchránili svoj flek a zdôvodnili svoju nepostrádateľnosť.

Ako som už spomínal pre štatistikov je tento konflikt záujmov obzvlášť relevantný keďže ich kolegovia z oblasti učenia stroje tak celkom nedomysleli svoje ciele do dôsledkov. Nedá mi nespomenúť Rainer Alexandrowitza, ktorý pár rokov dozadu zaskakoval na katedre psychologickéj metodiky na LMU v Mníchove. Alexandrovitz sa nám na jednej prednáške k modelovaniu štrukturálnych rovníc posťažoval ako jeho americký kolegovia prišli s návrhom tento proces modelovania automatizovať (SEM sú podmnožinou grafických modelov, takže nie je až také ťažké si to predstaviť). Ešte dnes sa musím smiať keď si spomeniem ako Alexandrovitz na prednáške rozhodil rukami a zvolal, že toto naozaj nechceme, lebo tak skončíme všetci nezamestnaní. Alexandrowitz mal aj špeciálny novotvar “substanzwissenschaftlich” (príslovka vyjadrujúca niečo ako “vedecky opodstatnene”). Substanzwissenschaftlich bolo treba argumentovať a pracovať tam kde formálne metódy definitívne končia. O tom, že niekde (a často aj konkrétne kde) končia nemal Alexadrowitz pochýb. V jeho ponímaní bolo dôležitou súčasťou vyúčby naučiť študentov umeniu štatistiky – ako riešiť problémy ktoré nemožno automatizovať.

Na rozdiel od kolegov vedcov a štatistikov, však my psychológovia máme eminentný záujem na tom a aby sa pri skúmaní, pri hľadaní teórii, návrhu experimentov a vyhodnocovaní dát v ľudskom mozgu žiadne zázraky nediali. Práca vedcov spočíva na psychologických mechanizmoch, na schopnostiach riešenia problémov a získania vhľadu. Ako takú chceme túto činnosť pochopiť a v konečnom dôsledku (v tom zmysle, že počítačové modely sú najlepším spôsobom teoretizovania) formalizovať. Prvé zaujímavé návrhy už existujú a v tomto článku chcem ukázať ako možno formalizovať proces hľadania optimálneho modelu v časticovej fyzike.

V časticovej fyzike tvoria dáta pozorovania reakcii – rozpadu a zrážok elementárnych častíc. Elementrárne častice sú nazývané častice, ktoré nie sú atómy ani jadrá atómov. (Výnimku tvorí protón – ktorý je jadrom atómu vodíka a zároveň elementárnou časticou.) Tabuľka vyššie uvádza značky hlavných 22 častíc. Ak vám tieto značky nič nehovoria, je najvyšší čas odskočiť si na wikipédiu a naučiť sa ich mená naspamäť. IHNEĎ!!!

Dáta teda tvoria pozorované reakcie – rozpad a zrážky častíc. Napríklad po zrážke dvoch protónov zostanú dva protóny a jeden pión. Mión sa rozpadá na elektrón, elektrónové neutríno a miónové antineutríno. Úlohou modelu časticovej fyziky je popísať pozorované a predpovedať nepozorované interakcie. Formálne môžeme definovať model ako klasifikátor, ktorý nám pri každej reakcii povie či je možná alebo nemožná. Zaujíma nás či existuje stratégia pre voľbu modelu ktorá by nám na základe pribúdajúcich pozorovaní umožnila nájsť optimálny model.

Pre optimálnu stratégiu existuje séria pozorovaní určitej dĺžky na základe ktorej nám naša stratégia vypľuje správny model – model ktorý klasifikuje všetky budúce pozorovania správne, inak povedané model, ktorý nebude falzifikovaný. Nie je ťažké ukázať, že takáto stratégia neexistuje. Množina možných serií pozorovaní je omnoho väčšia ako množina modelov a pre každý model možno skonštruovať príklad, ktorý model falzifikuje. Napríklad ak sme opakovane pozorovali interakciu p+p \rightarrow p+p+\pi^0 (I1) stratégia musí v určitom momente dospieť k modelu, ktorý predpovedá interakciu p+p \rightarrow p+p+\pi^0+\pi^0 (I2) ako nemožnú (inak sa stratégia nemôže naučiť správny model pre prípad že I1 platí a I2 nie). V tom momente však môže byť náš model falzifikovaný pozorovaním I2. Po určitom množstve pozorovaní I1 a I2 môžeme dospieť k modelu ktorý hovorí že I1 aj I2 sú správne. Tento model však zároveň musí klasifikovať I3: p+p \rightarrow p+p+\pi^0+\pi^0+\pi^0 . Pomocou takéhoto množenia piónov možno pre každý model zostrojiť prípad, ktorý model potenciálne falzifikuje. Tým pádom neexistuje stratégia ktorá by nám umožnila nájsť na základe pozorovaní model, ktorý bude definitívne správny. Problémom vyššie uvedeného príkladu je že nikdy nezískame negatívnu evidenciu o tom, že určitá reakcia je nepozorovateľná. Avšak aj v prípade, že presne určíme sadu možných a nemožných reakcii existuje nekonečné množstvo modelov, ktoré tieto pozorovania vysvetľujú a medzi ktorými sa musíme rozhodnúť.

Samozrejme fyzici našli a používajú konkrétny model – tzv. štandardný model časticovej fyziky. Ako sa k nemu dopracovali? Viackrát na tomto blogu sme videli, že neriešiteľné induktívne problémy sa stanú zrazu riešiteľnými ak pridáme apriori znalosti resp. zahrnieme do inferencie určité predpoklady. Podobne je tomu aj v časticovej fyzike. Fyzici vychádzajú z existencie konzervačných zákonov. Tieto postulujú, že určité kvantity sa pri reakciách zachovávajú. Tieto konzervačné zákony časticovej fyziky sú motivované úspechom dávnejšie známych konzervačných zákonov ako je zákon zachovania energie alebo zákon zachovania hybnosti. V prípade časticovej fyziky však často ich teoretická pozícia nie je až taká silná a ich jedinou úlohou je spraviť problém hľadania modelu časticovej fyziky riešiteľným. Feynman (1965, p. 67) si napríklad sťažuje na teoretickú neuspokojivosť baryonového čísla: ‘‘If charge is the source of a field, and baryon number does the same things in other respects it ought to be the source of a field too. Too bad that so far it does not seem to be, it is possible, but we do not know enough to be sure’’.  Tabuľka vyššie uvádza päť nezávislých kvantít ktoré sa pri reakciách zachovávajú: baryonové, leptónové, miónové a tau číslo + elektrický náboj. Model zároveň musí určiť konkrétne hodnoty týchto kvantít pre každú časticu. Tabuľka vyššie uvádza hodnoty pre štandardný model.

Konzervačné princípy značne zjednodušujú inferenciu možných reakcii. Napríklad sa môžeme vrátiť k prípadu I1 vyššie. Pión musí niesť nulovú hodnotu každej kvantity. Tým pádom môžeme na základe konzervačného princípu tvrdiť, že aj I2, I3 a vskutku všetky Ik pre ľubovoľné sú možné. (To ešte neznamená, že sú pozorovateľné, že boli pozorované, alebo že boli/budú pozorované s rovnakou frekvenciou pre všetky k.) Všeobecne môžeme zredukovať problém hľadania možných reakcii na hľadanie lineárnej bázy pre pozorované reakcie. Množinu všetkých možných reakcii tak získame ako lineárny uzáver (linear closure). Príklad: R1 a+a \rightarrow a+a+b+b a R2 a \rightarrow b boli pozorované. Tieto reakcie možno vyjadriť ako vektory (0,2) a (-1,1), kde prvá pozícia vyjadruje vznik/úbytok častíc a a druhá pozícia to isté pre časticu b . Množina všetkých možných reakcii je definovaná ako c(0,2) + d(-1,1) kde c a d sú celé čísla.

Konzervačné princípy umožňujú rozlíšiť nepozorované a nemožné reakcie a teda riešia problém s negatívnou evidenciou. Reakcie, ktoré nezachovávajú konzervované kvantity sú nemožné a naopak všetky ostatné sú možné:

There is an unwritten precept in modern physics, often facetiously referred to as Gell-Mann’s totalitarian principle, which states that ‘‘anything which is not prohibited is compulsory’’. Guided by this sort of argument we have made a number of remarkable discoveries from neutrinos to radio galaxies. (Bilaniuk & Sudarshan, 1969)

Samozrejme občas sa stane, že nemožné reakcie sú pozorované. Napríklad R1 a R2 implikujú, že q(a)=0, q(b)=0. Povedzme, že sme pozorovali reakciu R3 a \rightarrow c a náš model hovorí že q(c)=1. Táto reakcia nesmie existovať. To by znamenalo, že konzervované kvantity sme postulovali nesprávne. Takéto anomálie je však možné vysvetliť aj inak ako úpravou konzervačných zákonov. Môžeme postulovať výskyt nepozorovaných – t.j. skrytých častíc. R1 môžeme napríklad upraviť na R1b a+a \rightarrow a+a+b+b+d, kde d je nová skrytá častica. R1b, R2 a R3 existujú pre q(a)=1, q(b)=1, q(d)=-2 a pre vyžadované q(c)=1. Vo všeobecnosti, postulovanie skrytých častíc umožňuje vysvetliť existenciu určitých reakcii. Postulovanie skrytých častíc pre určité reakcie môže mať testovateľné implikácie pre ďalšie reakcie. Takisto s rozvojom experimentálnej technológie sa môžu stať skryté častice priamo alebo nepriamo pozorovateľnými. Ako slávne príklady môžu poslúžiť neutrína (postulované Paulim roku 1930) alebo Higgsov bozón (postulovaný Petrom Higgsom roku 1963). Graf nižšie ilustruje úspešnosť štandardného modelu pri predpovedaní existencie častíc a s nimi spojených konceptov.

Samozrejme mohlo to byť aj inak. Ak by sa nepodarilo nájsť Higgsov bozón bolo by potrebné prispôsobiť množinu postulovaných častíc a v extrémnom prípade aj prekopať konzervačné zákony. Toto spektrum siaha od jednoduchej modifikácie štandardného modelu až po jeho falzifikáciu a nahradenie iným modelom.

Nechajme však postulovanie nových častíc bokom. Predpokladajme že všetky pozorované reakcie častíc majú konzistentnú interpretáciu. Ako nájsť správne konzervačné zákony, ktoré takúto interpretáciu umožňujú? Tento problém je znova ľahko riešiteľný pomocou lineárnej algebry. Zachovávané kvantity tvoria lineáne uzavretý priestor vektorov. Napríklad môžeme definovať Šimkovicove číslo ako baryonové  + miónové číslo (B a M kvantity v tabuľke). Je jasné, že ak sú miónové číslo a baryonové číslo zachovávané, tak reakcie zachovávajú aj Šimkovicove číslo. Našou úlohou je tak nájsť bázu tohoto lineárne priestoru. Konkrétne tento priestor tvorí ortogonálny komplement priestoru možných reakcii.

V tomto článku nás zaujímajú dve otázky. Po prvé nakoľko zodpovedá vyššie popísaná stratégia spôsobu, ktorým fyzici dospeli k svojmu súčasnému modelu t.j. štandardnému modelu. Umožňuje ďalšie lepšie modely, resp. ďalšie v predpovediach ekvivalentné rmodely? Po druhé na koľko je táto stratégia optimálna? Existujú apriórne princípy ktoré hovoria v prospech vyššie popísaného formalizmu lineárnej algebry.

Schulte (2008) implementoval vyššie popísanú stratégiu hľadania modelov. Ako dáta vyextrahoval 205 nezávislých reakcii z literatúry pre 182 známych častíc. Veľkú časť týchto dát tvoria informácie o rozpade individuálnych častíc, ktoré zhŕňa a publikuje Annual Review of Particle Physics. (Dáta a programy nájdete tu.) Schulteho program produkuje riešenia ktoré sú empiricky ekvivalentné štandardnému modelu – t.j. predpovedajú presne tie isté množiny správnych a nesprávnych reakcii. Tieto riešenia sa však môžu rozchádzať čo sa týka definície konkrétnych kvantít. Technicky vzaté môžeme nájsť viaceré bázy, ktoré definujú ortogonálny komplement k priestoru reakcii. Napríklad model zachovavájúci miónové, tau, elektrónové a Šimkovicovo číslo tvorí tiež bázu. (Náboj častice – C, je z veľkej časti daný cez zákon zachovania elektrického náboja a v rovniciach ho môžeme reprezentovať ako danú nezávislú kvantitu, preto túto kvantitu v ďalšej diskusii opomeniem.). Tento model je ekvivalentný k štandardnému modelu v tom zmysle, že predpovedá rovnaké reakcie. Prečo by sme teda mali preferovať štandardný model pred tým Šimkovicovským? Konzervované kvantity štandardného modelu definujú vlastnosti častíc a takisto rodiny častíc (baryónová, miónová, tau a elektrónová rodina). Ak je definícia kvantít ľubovoľná (v zmysle že existujú iné ekvivalentné definície), tak je aj ontológia častíc postulovaná štandardným modelom ľubovoľná, či nie?

V prvom rade treba dodať, že všetky riešenia, ktoré Schulteho program produkuje rešpektujú rozdelenie častíc na častice a antičastice. V tabuľke vyššie si môžete všimnúť, že pri každej kvantite možno nájsť pár s pozitívnym a negatívnym znamienkom. Tento fenomén nájdeme v prípade každej bázy, v prípade každého empiricky optimálneho modelu. Ďalej treba dodať, že môžeme použiť ďalšie neempirické princípy na to, aby sme vybrali z ekvivalentných modelov. Weinberg hovoril o kráse. My môžeme hovoriť o jednoduchosti. Napríklad ak si predstavíte v tabuľke stĺpec pre Šimkovicove číslo (B+M) tak tento bude obsahovať 10 nenulových hodnôt. Stĺpec pre baryonové číslo je jednoduchší a krajší v tom zmysle že obsahuje menej nenulových hodnôt. Vskutku Schulte zistil, že ak minimalizujeme počet nenulových hodnôt ako sekundárne kritérium tak získame štandardný model ako unikátne riešenie! Ďalším atraktívnym faktom je že nenulové hodnoty pre stĺpce B,M,E,T tvoria exkluzívne skupiny Žiadny riadok (častica) neobsahuje dve nenulové hodnoty. Tým je možné rozdeliť častice do rodín, pre ktoré možno následne hľadať nezávisle fundamentálnejšie princípy (napríklad ako kvarky tvoria baryóny).

Schulteho algoritmus modeluje hľadanie štandardného modelu ako sa tomu dialo vo fyzike v 60., 70. rokoch, keď hlavnými indíciami boli reakcie. Aj vtedy však už existovali nezávislé princípy ktoré umožňovali uprednostniť určitý model. Napríklad, ak si zoradíme častice podľa ich hmotnosti tak uvidíme obrovskú priepasť medzi hmotnosťou baryónov (ťažké) a leptónov. Toto pozorovanie tvorí nezávislú evidenciu pre vytvorenie baryónovej rodiny častíc. Takisto Schulteho dáta nezahŕňajú určité anomálie, ako napríklad oscilácie neutrín – reakcie popierajúce konzervačné princípy štandardného modelu. Pointa je v tom, že všetky tieto dodatočné zdroje informácii a pochybností by sme mohli zahrnúť. Zaujímavé je, že aj bez nich algoritmus unikátne identifikuje štandardný model.

Vyššie uvedené výpočty štandardného modelu pomocou lineárnej algebry sme viac-menej vytiahli z rukáva. Je možné toto riešenie podložiť nejakým konceptom optimality?  Vskutku Schulte (2000,2008) ukázal, že metóda výpočtu tvorí v určitom zmysle optimálnu a jedinú optimálnu stratégiu. Tento koncept optimality funguje na snahe minimalizovať počet falzifikácii modelu než konvergujeme k správnemu modelu. Snažíme sa dopracovať k riešeniu bez toho aby sme často menili náš názor na to ktorý model je v danom čase, pri danej evidencii správny. Najlepšou takouto stratégiou je v každom kroku vytvoriť minimálnu teóriu zahŕňajúcu a vysvetľujúcu súčasné pozorovania. Toto je presne to čo robí vyššie citovaný Gell-Mannov totalitaristický princíp. Súčasné pozorovania implikujú určitú množinu možných pozorovaní. Všetky ostatné pozorovania sú nemožné. Schulte ukázal, že táto stratégia garantuje  existenciu konečného worst-case počtu zmien názoru pre každú sériu pozorovaní. Inak povedané metóda garantuje konvergenciu (ak správne riešenie existuje).

Podobným spôsobom sa možno pozrieť aj na historický proces objavovania modelov v chémii, kde sú často reakcie reprezentované vo forme rovníc. Všeobecnejšie možno Schulteho princíp minimalizácie zmien názoru v priebehu jeho hľadania správneho modelu identifikovať so “silnou inferenciou” Johna Platta. Platt (1964) sa pozastavil nad systematickosťou a nekompromisnosťou experimentovania a teoretizovania v časticovej fyzike a v molekulárnej biológii, ktoré viedli k obrovskému pokroku v týchto oblastiach v 60. a 70. rokoch. Tento sa vyznačoval práve tým, že sa snažil minimalizovať počet krokov, ktoré vedci museli podstúpiť na ceste k správnemu modelu. Platt srdečne odporučil tento spôsob silnej inferencie vedcom v sociálnych vedách. Jeho nápad nemôže fungovať. Štatistická neistota výsledkom pritom nie je hlavným problémom. Teoreticky môžeme zvýšiť počet pozorovaní/probantov a opakovane replikovať experiment tak, že pravdepodobnosť daného výsledku sa bude blížiť k istote. Viaceré súčasné replikačné iniciatívy v psychológii sa uberajú týmto smerom. Silná inferencia v psychológii nemôže fungovať, lebo predmet výskumu nie je možné rozkúskovať na atomárne binárne (platné/neplatné) hypotézy.  V tomto ducha sa niesla Newellova kritika experimentálnej psychológie, ktorej argumenty zhŕňa môj starší článok.

Norbert Bischof zvykol poznamenať, že psychológovia nie sú hlúpejší ako fyzici. Fyzici mali šťastie, že im výsledky v podstate padli do náruče bez väčšieho snaženia. Videli sme ako pomocou matematických formalizmov možno dodatočne zdôvodniť postup akým sa generácie fyzikou dopracovali k štandardnému modelu časticovej fyziky. Inferencia v psychológii je naproti tomu omnoho ťažšia. Vskutku nie je vôbec jasné akým smerom by sa mala inferencia v psychológii uberať. Myslím, že toto je dobrá príležitosť postaviť kozu pred voz a formálne vypracovať optimálnu inferenčnú stratégiu predtým než začneme pumpovať zdroje do zberu dát.

Bilaniuk, O.-M., & Sudarshan, E. C. G. (1969). Particles beyond the light barrier. Physics Today, 22, 43–52.

Feynman, R. (1965). The character of physical law (1990 ed., Vol. 19). Cambridge, MA: MIT Press.

Platt, J. R. (1964). Strong inference. Science, 146(3642), 347-353.

Schulte, O. (2000). Inferring conservation laws in particle physics: A case study in the problem of induction. The British Journal for the Philosophy of Science, 51, 771–806.

Schulte, O. (2008). The co-discovery of conservation laws and particle families. Studies In History and Philosophy of Science Part B: Studies In History and Philosophy of Modern Physics, 39(2), 288-314.

Diskusia o bayesiánskej filozofii

Andrew Gelman zhrnul svoju filozofiu analýzy dát v článku, ktorý vyšiel aj s diskusiou v britskom časopise pre matematickú a štatistickú psychológiu. Bayesiánska štatistika býva stotožňovaná s induktívnou filozofiou v protiklade s dominantným deduktívnym frekventistickým prístupom. Podľa tejto tradičnej bayesiánskej filozofie spočíva vedecký proces v postupnej zmene pravdepodobností rôznych hypotéz (= teórii) na základe pribúdajúcich dát.Tento proces je znázornený nižšie. Zľava doprava pribúdajú dáta a pravdepodobnosť hypotéz sa mení.

Falzifikácia a objavovanie nových hypotéz nemá v tomto prístupe priestor. Všetky hypotézy a teórie sú prítomné a vyhodnocované od začiatku zberu dát. Takáto predstava nekorešponduje so skutočným vedeckým procesom a ani nereflektuje rozšírenú bayesiánsku prax. Bayesiánske analýzy namiesto toho postupujú hypoteticko-deduktívne. Tento prístup prístup spočíva v postulovaní štatistickeho modelu, ktorý je následne testovaný, falzifikovaný a vylepšený. Táto falzifikácia pritom môže nastať bez toho aby sme získali nové dáta – falzifikácia prebieha s pomocou základe dát pomocou ktorých sme model vytvorili a ktorý slúžil získanie parametrov.

Bayesiánske modely umožňujú vygenerovať pomocou modelu syntetické dáta. Tieto sú následne porovnané s aktuálnymi dáta a ak je diskrepancia medzi modelom a realitou vážna je potrebné štatistický model vylepšiť. Túto diskrepanciu je možné určiť aj kvantitatívne avšak väčšinou sa deje porovnanie kvalitatívne resp. graficky. Takúto analýzu som ilustroval aj na Mozgostrojoch. Takisto treba dodať, že tento hypoteticko-deduktívny prístup nie je vôbec nový. Stretli sme sa s ním napríklad u E.T. Jaynesa. Ďalším dôležitým proponentom je George Box a analýzy časových rád Box-Jenkinsovou metódou sú jeho najlepším príkladom. Hypoteticko-deduktívny prístup možno z časti identifikovať ako filozofiu objektívnych bayesiánov v kontraste k subjektívnym bayesiánom, ktorý preferujú induktivistickú filozofiu.

Priznám sa, že som sa vo svojej mladej vedeckej kariére s induktivistickou bayesiánskou filozofiou takmer nestretol a mená ich zástancov ako Lindley, Savage podobne ako Popper a Fischer na druhej strane barikády sú pre mňa historickými referenciami. Myslím, že celá debata indukcia verzus dedukcia je dnes už zbytočná. Moderný prístup bude ich zmesou. Takisto si myslím, že existujú dôležitejšie a pragmatickejšie otázky ako zisťovať akú a ktorú proporciu tejto zmesy tvorí indukcia resp. dedukcia, ako indukciu, dedukciu zadefinovať a či treba zahrnúť aj ďalšie spôsoby inferencie ako abdukcia, analógia etc.

Zaujímavé otázky sa týkajú problému ako deduktívny krok štatistickej analýzy formalizovať a automatizovať. Deduktívny krok nezahŕňa len testovanie modelu ale určuje aj smer ktorým sa následne analýza vyberie – ako model vylepšiť, ktorý model testovať v ďalšom kroku. (V tomto zmysle “deduktívny krok” zahŕňa indukciu, keďže dedukcia nám neumožňuje z rozporu a falzifikácie nič konštruktívne vyvodiť.) Časťou problému je nájsť spôsob ako reprezentovať množinu všetkých modelov. Táto množina musí byť dostatočne veľká aby zahrnula optimálne riešenia a pri všemožných analýzach – teda aby bola automatizovaná metóda dostatočne všeobecná a aplikovateľná na celé spektrum štatistických problémov. Na druhej strane je ťažké takúto rozsiahlu množinu modelov prehľadať. Ako zvoliť správnu sekvenciu modelov tak, aby sme sa dopracovali v čo najkratšej sérii krokov (=falzifikácii) k optimálnemu modelu? Tieto otázky sa dotýkajú roli kreativity a vhľadu vo vedeckom procese (a pri riešení problémov všeobecne) a ako kreativitu a vhľad formalizovať. Možno trochu typicky ostali tieto zaujímavé otázky pred bránami filozofickej diskusie. (Diskusiu však nájdete na Gelmanovom blogu aj s odkazmi na prvé pokusy o formalizáciu – tu, tu a tu.)

Gelman, A., & Shalizi, C. R. (2013). Philosophy and the practice of Bayesian statistics. British Journal of Mathematical and Statistical Psychology, 66, 8–38