Knobeho efekt

Znova som raz pristihol filozofov ako balia vzduch do fliaš a predávajú ho ako výskum. Knobeov efekt má za čieľ ilustrovať, že aktérove ciele ovplyvňujú morálny úsudok pričom tradične sa predpokladá, že inferencia funguje len opačným smerom.

Demonštrácia Knobeho efektu funguje nasledovne:

The vice-president of a company went to the chairman of the board and said, “We are thinking of starting a new program. It will help us increase profits, but it will also harm the environment.” The chairman of the board answered, “I don’t care at all about harming the environment. I just want to make as much profit as I can. Let’s start the new program.”
They started the new program. Sure enough, the environment was harmed. (Knobe, 2010, s. 191)

V tomto prípade ľudia tvrdia, že riaditeľ úmyselne znečistil prostredie. Ak však zameníme v príklade vyššie “harm” za “help” ľudia odpovedajú, že riaditeľ nepomohol prostrediu úmyselne. Knobe tvrdí, že v tom prvom prípade je kritické, že správanie je považované za amorálne. Preto v prvom prípade je správanie považované za úmyselné zatiaľčo v druhom prípade je považované za neúmyselné.

Skúsme nasledujúci príklad.

Albert prišiel domov zo školy. Vytiahol zo skrine najväčšiu panvicu a ide sa na nej špúšťať na kopec za dom. Mama mu hovorí, ‘Albert nekĺzaj sa na panvici lebo ju doškrabeš.’ Albert hovorí že mu je jedno že panvicu doškrabe, hlavne že sa na nej posánkuje. Albert sa odišiel kĺzať na kopec za dom. A vskutku, panvica bola doškrabaná.

Otázka: doškrabal Albert panvicu úmyselne? Odpoveď: Áno

Príbeh pokračuje.

Barbora príde domov, vyberie zo skrine najväčšiu panvicu a ide sa na nej špúšťať na kopec za dom. Mama jej hovorí, ‘Barbora nekĺzaj sa na panvici lebo ju doškrabeš.’ Barbora hovorí že jej je to jedno že panvicu doškrabe, hlavne že sa na nej posánkuje. Barbora sa odišla kĺzať na kopec za dom. A vskutku, panvica bola doškrabaná.

Otázka: doškrabala Barbora panvicu úmyselne? Odpoveď: Nie. Prečo? Lebo panvicu doškrabal Albert už pred ňou. Barbora teda nedoškrabala panvicu a teda ju nedoškrabala úmyselne.

Pointa je v tom, že kauzálna štruktúra v Knobeovom prípade s “harm” je podobná Albertovmu prípadu zatiaľčo kauzálna štruktúra v prípade s “help” je podobná Barborinmu prípadu. Je tomu tak preto lebo a) prostredie je v dobrom stave, ktorý už nemožno vylepšiť avšak, ktorý možno zhoršiť, b) firma môže do veľkej miery zničiť prostredie (napr. BP sú v tom experti) avšak ťažko firma nejak radikálne prostrediu pomôže. Vskutku ak firmy a politici hovoria o tom, že chcú prostrediu pomôcť, tak sa hovorí o zamedzení emisii alebo inej redukcii už existujúcich (úmyselných) negatívnych vplyvov na prostredie. Ťažko v týchto prípadoch hovoriť o tom že dotyčný prostrediu pomohli, keďže iba redukovali svoj vplyv. Knobeho effekt nemá nič spoločné s úmyslami alebo s morálnosťou konania, ale je dôsledkou odlišnej kauzálnej štruktúry použitých príkladov.

Čo dodať na záver? Zabudnite na myšlienkové experimenty. X-phi, to je budúcnosť predávania vzduchu vo flašiach. X-phi je budúcnosť filozofie!

Knobe, J. (2010). Person as scientist, person as moralist. Behavioral and Brain Sciences, 33, 315–329.

Záhada chýbajúceho štvorca

Nasledujúci problém by mal byť čitateľom intímne známy.

Práve prechádzam Knuthovu Concrete Mathematics, kde som zistil, že vyššie uvedený trik má aj zaujímavé pozadie. To pozadie tvoria Fibbonaciho čísla.

Tieto sú dané rekurziou

F_n = F_{n-1}+F_{n-2}

F_0 = 0, F_1=1

Takto získame postupnosť čísel 0,1,1,2,3,5,8,13,21,34,55,89,144… S Fibonacciho číslami možno zažiť kopec srandy a dopracovať sa k zaujímavým výsledkom. Nás zaujíma Cassiniho rovnosť:

F_{n+1}  F_{n-1}= F_n^2 +(-1)^n

ktorú možno dokázať pomocou indukcie. Túto rovnosť možno interpretovať nasledovne. Ak máme štvorec s obsahom F_n \times F_n  štvorčekov tak k nemu existuje obdĺžnik s rozmermi F_{n+1} \times F_{n-1}, ktorého obsah je o jeden štvorček menší/väčší, v závislosti od toho či je n párne alebo nepárne. Ľavý štvorec môžeme rozdeliť na dva štvoruholníky a dva trojuholníky, ktorých body majú vzdialenosť k hrane štvorca F_{n+1},F_{n}, F_{n-1} alebo F_{n-2}. Na prvý pohľad to vyzerá tak, že rovnako môžeme rozdeliť aj pravý štvorec.

Zdanie však klame. Všetky časti vpravo sú štvoruholníky (inak dĺžka čiar nesedí). Ak zvolíme tenšiu čiaru alebo menšie Fibonacciho číslo tak časti z ľavého štvorca do ľavého obdĺžnika nenapcháme.


Podobne funguje aj záhada chýbajúceho štvorca. Ak zmeriame rozmery trojuholníkov a ich častí, aj tu nájdeme zopár Fibonacciho čísiel. Problém však nemožno zovšeobecniť a vytvoriť ďalšie príklady pre vyššie Fibonacciho čísla. Ak je dlhšia vertikálna strana zelenej časti a, kratšia je b a dlhšiu a kratšiu stranu žltej časti označíme c a d. Tak vpravo musí platiť a=c a vľavo a+b=c+d a teda b=d. Zároveň však chceme aby b+d=a=c a  aby buď b alebo d bolo rovné 1 a teda musí platiť b=d=1 a c=a=2. Jediné riešenie, ktoré spĺňa podmienky je na začiatku uvedený problém.

Pripájam ešte program pre Python, ktorý vám umožní vygenerovať štvorce a obdĺžniky.

import numpy as np
import pylab as plt

def fibo(n): return int(((1 + 5**0.5)/2)**n/5**0.5+0.5)
s=4;e=9
for N in range(s,e):
    f0=fibo(N-2)
    f1=fibo(N-1)
    f2=fibo(N)
    f3=fibo(N+1)
    lw=2
    plt.figure(0)
    plt.subplot(e-s,2,(N-s)*2+1)
    plt.xlim([0,f2])
    plt.ylim([0,f2])
    ax=plt.gca()
    ax.set_xticks(range(f2))
    ax.set_xticklabels([])
    ax.set_yticks(range(f2))
    ax.set_yticklabels([])
    ax.set_aspect(1)
    plt.grid(linestyle='-')

    plt.plot([0,f1],[f1,f0],'k',lw=lw)
    plt.plot([f1,f1],[0,f2],'k',lw=lw)
    plt.plot([f1,f2],[0,f2],'k',lw=lw)

    plt.subplot(e-s,2,(N-s+1)*2)
    plt.xlim([0,f3])
    plt.ylim([0,f1])
    ax=plt.gca()
    ax.set_xticks(range(f3))
    ax.set_xticklabels([])
    ax.set_yticks(range(f1))
    ax.set_yticklabels([])
    ax.set_aspect(1)
    plt.grid(linestyle='-')

    plt.plot([0,f3],[f1,0],'k',lw=lw)
    plt.plot([f1,f1],[0,f0],'k',lw=lw)
    plt.plot([f2,f2],[f1,f1-f0],'k',lw=lw)
plt.show()

Kahneman: Thinking, Fast and Slow

Toto je snáď môj posledný príspevok Kahnemanovej knihy. V ňom chcem diskutovať niektoré menšie témy, ktoré som opomenul v minulých článkoch. Takisto chcem zhrnúť môj dojem z knihy. Samozrejme diskusia sa bude týkať Kahnemanovej teoretickej pozície. Kniha má pekný biely obal, priateľskú cenu a dobre sa číta. To nás na tomto mieste nezaujíma.

Kniha má 5 častí. Prvá časť sa zaoberá Systémom 1 (rýchla lenivá intuícia). V druhej časti Kahneman rozoberá svoj výskum biasov a heuristík. V tretej časti ukazuje, že biasy nájdeme aj u expertov – sudcov, maklérov alebo investorov. V štvrtej časti predstavuje svoju teóriu rozhodovania – t.j. prospektovú teóriu, ktorá sa stala základom behaviorálnej ekonómie. Piata časť sa venuje jeho výskumu šťastia a spokojnosti ľudí so životom. Druhá a štvrtá časť tvoria jadro Kahnemanovho výskumnej kariéry a jeho prínosu. Venoval som sa im v predchádzajúcich príspevkoch. Tu sa chcem krátko vrátiť k prvej časti knihy.

Prvá časť je venovaná Systému 1. Jadro evidencie tvorí psychologický výskum podvedomého vnímania. Výsledky väčšiny týchto štúdii sú dnes už dobre podložené a patria ku klasickým experimentom. Pred dvoma rokmi, keď kniha vychádzala by sme k nim zaradili aj štúdie venujúce sa tzv. sociálnemu primingu. Klasikou v tomto štýle je štúdia Bargha, kde študenti najprv riešili anagramy. Po tom čo študenti dokončili anagramy bola meraná rýchlosť, s ktorou prešli chodbou vedúcou z labáku k východu z budovy. Študenti sa pohybovali pomalšie ak anagramy obsahovali slová a výrazy vzťahujúce sa na starobu. Výskum sociálneho primingu prominentne figuruje v práve zúriacej kríze replikovateľnosti psychologického výskumu. Dobrý nedávny prehľad problémov so štúdiami sociálneho primingu nájdete tu. V skratke, súčasná situácia vyzerá nasledovne. Niekoľko publikácii demonštrujúcich sociálny priming bolo stiahnutých. Iné sa nepodarilo replikovať a počet neúspešných replikácii má stúpajúcu tendenciu. To je z Kahnemanovho pohľadu na prd, keďže na týchto výsledkoch vystaval odvážne tvrdenia vo viacerých kapitolách. So škodoradosťou si napríklad môžeme pripomenúť nasledujúcu pasáž z konca štvrtej kapitoly, ktorá sa zaoberá práve sociálnym primingom:

When I describe priming studies to audiences, the reaction is often disbelief. This is not surprise: System 2 believes that it is in charge and that it knows the reasons for its choices. […] The idea you should focus on, however, is that disbelief is not an option. The results are not made up, nor are they statistical flukes. You have no choice but to accept that the major conclusions of these studies are true. More important, you must accept that they are true about you (s. 56-57)

Zdá sa že Kahnemanovi tiež nie je z najnovšieho retroaktívneho vývoja evidencie dvakrát do skoku. Minulý rok reagoval na situáciu otvoreným mailom, kde vyzval výskumníkov sociálneho primingu aby očistili svoju výskumnú oblasť od pochybností. Z emailu vyplýva aj že Kahneman stále verí v existenciu týchto primingových efektov. Iní výskumníci tomuto výskumu toľko neveria a odzrkadľuje sa to aj na vnímaní Kahnemanovej knihy. Napríklad britský psychológ David Shanks zaradil vo svojej prednáške Kahnemanovu knihu do blacklistu momentálne trendovej pop-sci literatúry, tvrdiacej, že ľudské správanie je pod nadvládou podvedomých faktorov. Táto literatúra argumentuje aj výskumom sociálneho primingu.

Myslím, že Shanksova reakcia je v tomto ohľade prehnaná. Sociálny priming tvorí krátku a nie moc podstatnú časť knihy. Naopak Kahnemanov výskum biasov a rozhodovanie bol mnohokrát replikovaný. Vskutku viaceré výsledky si môže každý pre seba demonštrovať na stránkach knihy. V tomto zmysle sú podobné vizuálnym ilúziam. Na druhej strane, že Kahneman pripisuje nevydarené replikácie sociálneho primingu neschopnosti autorov týchto replikácii (lebo títo údajne nemajú expertízu a skúsenosť s primingom) mi moc nevonia. Na tejto reakcii, ale aj v autobiografických úsekoch knihy vidieť, že Kahneman patrí ku generácii psychológov, pre ktorých je dizajn a prevedenie experimentov viac umenie ako, ehm, veda. Aj Kahnemanove experimenty sú perfektne vyladené aby autori získali silný efekt. Problém takéhoto ladenia je, že vyladené experimenty sú citlivé na okolnosti a konfiguráciu prostredia – takže ich nemožno rovnako efektne replikovať v iných labákoch. Takisto výsledky následne nemusia zovšeobecňovať tak ako autori experimentu zamýšľali. Napríklad experiment na strane 7:

Písmeno k. Je pravdepodobnejšie že sa k objaví ako prvé alebo ako tretie písmeno slova?

Probanti tvrdia, že prvé je pravdepodobnejšie, pritom frekvencia slov kde k je tretie písmeno je vyššia. Kahneman a co. preukázali našli tento efekt pri písmenách (K,L,N,R,V). Kahneman tvrdý, že probanti volia prvé písmeno, lebo ľahšie dokážu vyvolať slová s prvým písmenom z pamäte. Gigerenzer a co. (Sedlmeier et al., 1998) vyskúšali aj ďalšie písmená avšak zistili, že Kahnemanove predpovede nezovšeobecňujú. Nie je ťažké si domyslieť čo sa stalo. Koniec koncov Kahneman sám s hrdosťou popisuje svoj postup pri dizajne experimentov. Nové problémy a úlohy vždy vyskúšali najprv na sebe. Ak u seba zistili bias tak úlohy vyskúšali na vzorke probantov, ktorý väčšinou ukázali rovnaké správanie. Problematická je vzorka úloh, ktoré u autorov nezafungovali a následne neboli testované ani publikované. Tieto úlohy v podstate končia v psychológovej zásuvke. Toto zásuvkovanie podkopáva reprezentatívnosť a robustnosť výskumu – jeho výsledkov a záverov. Pochybnosť týchto praktík samozrejme nebola vôbec tematizovaná v 80. a 90. a ešte aj dnes je povedomie medzi sociálnymi psychológmi nízke. Nie je ťažké si predstaviť, kde sa Kahneman a co. takýmto experimentálnym postupom inšpirovali. Kahneman na viacerých miestach porovnáva biasy s optickými ilúziami. Vizuálne vnímanie je robustné voči kognitívnemu a sociálnemu kontextu. Müller-Lyer ilúziu vnímame nezávisle od farby čiar, pozadia, kontrastu, nezávisle či je ilúzia znázornená na papieri alebo na monitore počítača, či sme už večerali, alebo či vieme, že ide o ilúziu a či vôbec vedome chceme zamedziť chybnému vnemu. Ilúziu v určitom rozsahu vnímame vždy. Kognícia a rozhodovanie sú naopak vysoko citlivé na kontext. V tomto prípade nemôžeme len tak na základe pozorovaní zopár mylných rozhodnutí v určitom kontexte zovšeobecniť na existenciu biasov. Musíme sa uistiť či výsledky nie sú ovplyvnené irelevantnými faktormi, ako je tvar písma, zvuk vyslovenej hlásky, veľkosť slovnej zásoby probanta alebo jazyk, ktorý používa.

Aby som to zhrnul. Myslím, že replikovateľnosť nie je pre Kahnemanovu teóretickú pozíciu kritická. Problém vidím v ekologickej validite – teda v otázke ako dobre možno výsledky zovšeobecniť. Najpresvedčivejšie mi pripadajú pozorovania biasov a chybného rozhodovania u expertov v rutinných úlohách. Rozhodovanie sudcov je ovplyvnené časom ich posledného jedla. Maklérov odhad hodnoty nehnuteľnosti je ovplyvnený kotviacim efektom. Rozhodovanie investorov a finančníkov netreba ani rozoberať. To neznamená, že ľudia chronicky trpia biasmi. Skôr to ukazuje, že kontext a spôsob rozhodovania v týchto prípadoch je zvolený nesprávne. Väčšina týchto rozhodovacích kontextov je netypická pre prirodzené sociálne prostredie s ktorým má človek najviac skúsenosti a ktoré ovplyvňuje jeho správanie. Interview je dobrý spôsob ako nájsť vhodného partnera/partnerku. To neznamená, že je to najlepší spôsob ako nájsť kompetentného zamestnanca. Nezávisle od odlišnej interpretácie príčin chybného rozhodovania sa môžeme zhodnúť s Kahnemanom, že rozhodovanie možno vylepšiť použitím alternatívnych rozhodovací stratégii alebo zmenou kontextu problému.

Kritiku Kahnemanovho spôsobu navrhovania experimentov možno zobrať zo širšieho pohľadu. Pre zvolenie zaujímavých, diagnostických experimentov je dôležitá teória a jej predpovede. U Kahnemana funguje teoretizovanie post-hoc a má deskriptívnu úlohu. Sarkasticky by sme mohli povedať, že Kahneman hľadá a zbiera zaujímavé prípady biasov. Ak takýto prípad nájde, následne popíše vedeckou terminológiou čo probant robí a toto nazýva teóriou. V predchádzajúcom článku sme videli príklady problémov vyhodnocovaním pravdepodobnosti udalostí – feministka Linda, farmár Štefan. Postulovaním vplyvu reprezentatívnosti/plauzibility na rozhodovanie Kahneman len preložil výsledky do vedeckého jazyka. Tento popis nepridáva pozorovaniam na hodnote. Neumožňuje totiž získať žiadne precízne kvantitatívne predpovede pre nové situácie. Presne toto však dokáže bayesiánsky formalizmus. Tento tým spĺňa aj explanačnú úlohu, ktorá je kritériom dobrej teórie. Kahneman pre mňa reprezentuje predteoretickú psychológiu. Kahneman je ako motýľkar, ktorý sa snaží na základe svojej zbierky zopár exotických exemplárov vytvoriť teóriu motýľov. V biológii predchádzali Darwinovej rôzne zberateľské a kategorizačné pokusy. Vedci pred Darwinom ponúkli hierarchie a taxonómie organizmov. Tieto pokusy boli dôležitým krokom na ceste k teórii evolúcie avšak boli čisto deskriptívne a v tomto zmysle nešlo o skutočné teórie. Podobne možno vnímať aj Kahnemanov pokus. Kahneman sa sám k k čisto deskriptívnym cieľom priznáva. Používa trochu inú metaforu – metaforu lekárskych diagnostických systémov. Rôzne diagnostické systémy ako ICD alebo DSM poskytujú lekárom spoľahlivé jednoduché pravidlá ako priradiť symptómy k diagnóze. Kahneman tvrdí, že cieľom jeho knihy je poskytnúť podobné kritéria, aby bežný človek mohol lepšie reflektovať svoje biasy a rozhodnutia. V konečnom dôsledky však medicínske diagnostické systémy vychádzajú z overených teórii a modelov fungovania ľudského tela. V tomto ohľade Kahnemanov klasifikačný systém zaostáva za svojimi medicínskymi proťajškami.

Kahneman, D. (2011). Thinking, fast and slow. Farrar, Straus and Giroux.

Sedlmeier, P., Hertwig, R., & Gigerenzer, G. (1998). Are judgments of the positional frequencies of letters systematically biased due to availability? Journal of Experimental Psychology: Learning, Memory and Cognition, 24, 754–770.

Rozhodovanie podľa teórie očakávaného úžitku

Dostal som sa k štvrtej časti knihy ale zasa sa neviem dopracovať k spokojnosti. Nepozdáva sa mi spôsob akým Kahneman modeluje predpovede teórie očakávaného úžitku.

Stručný popis teórie očakávaného úžitku (expected utility theory, EUT) si môžete prečítať na samorybných mémoch, tu sa budem sústrediť na modelovanie.

Kahneman tvrdí, že podľa EUT sa aktéri budú rozhodovať len na základe očakávaného úžitku. Napr. na strane 279 ponúka nasledujúci (mnou na pomeri chudobného slovenského študenta upravený) príklad:

A: 9 Eur naisto alebo 90% šanca vyhrať 10 Eur.

Čo si zvolíte? Väčšina ľudí volí istých 9 Eur. Neskôr na strane 315 Kahneman ukazuje, že suma, ktorú sú ochotní ľudia akceptovať v takýchto experimentoch je systematicky výrazne nižšia ako 9 Eur –  v priemere okolo 7.12 Eur. Kahneman takisto poskytuje hodnoty z experimentov pre rôzne percentuálne scenáre – “vaša šanca získať 10 Eur je p, koľko Eur ste ochotný akceptovať naisto namiesto tejto hry”. Hodnoty z tabuľky som uviedol do grafu (modrá krivka).

Kahneman tvrdí, že podľa EUT by mali byť rozdiely medzi intervalmi rovnomerné a teda akceptované hodnoty by mali byť identické s očakávanou hodnotou ako znázorňuje čierna krivka (s. 279, 311). Ľudia to však vnímajú inak. Ak sa dozviem, že moja šanca získať milión Eur stúpla zo 60 na 65 % alebo z 95 na 100 % tak tú poslednú správu vnímame ako oveľa radostnejšiu. Teda EUT sa mýli.

V EUT sa moc nevyznám a je možné, že naozaj existujú verzie, ktoré predpovedajú čiernu krivku v grafe vyššie. Ukážem však, že Bernoulliho pôvodná verzia EUT predpovedá inú krivku. Vychádzajme z príkladu A. Musíme vyhodnotiť očakávanú utilitu dvoch situácii. V prvej situácii získame 9 Eur k nášmu doterajšiemu majetku m a náš úžitok je daný ako u(A_1) =u(m+9), kde u je úžitková funkcia prepočítavajúca sumy peňazí na sumy šťastia. V druhej situácii náš očakávaný úžitok tvorí u(A_2)=0.9 u(m+10) + 0.1 u(m), teda úžitok z výhry plus prehre vážený respektívnou pravdepodobnosťou scenára. Aby sme sa rozhodli musíme určiť, ktorá z dvoch situácii nám prinesie viac úžitku. Aby sme to zistili potrebujeme definovať úžitkovú funkciu. Bernoulli ukázal, že konkávna funkcia je dobrou voľbou. Po vzore Bernoulliho môžeme použiť logaritmus. Ak úžitok prvej situácie má byť väčší, musí platiť

u(A_1)>u(A_2)

u(m+9)> 0.9 u(m+10) + 0.1 u(m)

log(m+9)> 0.9 log(m+10) + 0.1 log(m)

Vidíme zaujímavú vec. Rozhodnutie závisí od nášho súčasného finančného stavu m. V tomto konkrétnom prípade bude stratégia A1 výhodnejšia pre všetky pozitívne m. Môžeme však analyzovať všeobecnú situáciu:

u(m+c)> p u(m+w) + (1-p) u(m)

kde c je výhra pri voľbe istoty, w je výhra v hazardnom scenári a p je pravdepodobnosť tejto výhry. Pre logaritmickú úžitkovú funkciu platí:

log(m+c)> p log(m+w) + (1-p) log(m)

log(\frac{m+c}{m})> p log(\frac{m+w}{m})

\frac{m+c}{m}> (\frac{m+w}{m})^p

1+\frac{c}{m}> (1+\frac{w}{m})^p

c> m((1+\frac{w}{m})^p-1)

Istú ponuku sa nám oplatí akceptovať pre hodnotu c vyššiu/rovnú ako výraz vyššie. Pre w=10, p=0.9 a m=20 získame c>8.81. Teda Bernoulliho riešenie je naozaj ochotné akceptovať nižšiu ako očakávanú hodnotu. Graf nižšie ukazuje kritické c v závislosti od p a červenú krivku možné porovnať s modrou v prvom grafe. Bernoulliho EUT kvalitatívne modeluje to, čo Kahneman nazýva certainty effect.

Čo sa deje? V čom spočíva Bernoulliho trik? Trik je v použitý konkávnej úžitkovej funkcie. Ak by sme použili lineárnu funkciu u(x)=a x + b tak získame

u(m+c)> p u(m+w) + (1-p) u(m)

a(m+c)+b > p a (m+w) + (1-p) a m +b

a m+a c+b > p a m+pa w + a m-p a m +b

c >p w = E[w]

Kritickou hodnotou je teda c=pw, kde pw nie nič iné ako očakávaná výhra, ktorú Kahneman podsúva ako predpoveď EUT. V tomto prípade narazíme na problém, ktorý sa práve Bernoulli snažil vyriešiť. Pri lineárnej funkcii sa neoplatí nikomu uzavrieť poistku a ani nijak inak obchodovať s rizikami. Pre poisťovňu totiž platí c_p <p w (keďže w tvorí stratu), zatiaľčo klient chce c_k >p w . Za takýchto okolností (a za rovnakých očakávaní) žiadne kompromisné c neexistuje. Konkávna funkcia túto situáciu mení. Vráťme sa k vyššie uvedenému výsledku pre kritické c

c> m((1+\frac{w}{m})^p-1)

Člen (\frac{w}{m})^p vyjadríme ako binominálnu postupnosť.

(\frac{w}{m})^p= \sum_{k=0}^\infty \binom{p}{k}(\frac{w}{m})^k = 1 +p\frac{w}{m} -\frac{p(1-p)}{2} (\frac{w}{m})^2+ \sum_{k=3}^\infty \binom{p}{k}(\frac{w}{m})^k

Pre vysoké m sú vyššie členy v postupnosti (k>2) zanedbateľne malé. Dosadíme preto len prvé tri členy do vzorca pre c a získame

c> pw -\frac{1}{2m} p (1-p) w^2

Členy na pravej strane som schválne upravil do formy, ktorá ukazuje jednu zaujímavú vec. Prvý člen vyjadruje očakávanú výhru a druhý člen koriguje toto očakávanie o proporciu odchýlky odhadu w. Platí totiž, že Var[w] = p(1-p) w^2 , a teda

c> E[w] -\frac{1}{2m} Var[w]

Tento vzorec nám káže odpočítať od očakávanej výhry sumu proporčnú riziku stávky. Druhý člen tvorí niečo ako cenu poistky, ktorú sme ochotný zaplatiť aby sme nemuseli hrať s rizikom. Pre Bernoulliho bol dôležitý koeficient  \frac{1}{2m} . Tento závisí od sumy peňazí, ktorú vlastním. Ak som bohatý, tak som sám sebe poisťovňou a neistota výhry ma nemusí trápiť. Ak som chudobný, variabilita je problémom, lebo hrozí že skončím s holým zadkom. Výsledkom je situácia, v ktorej sa bohatým oplatí poskytovať poistky chudobným. Vskutku Bernoulli uvažoval nad stratami a nie nad výhrami. Vzorec pre akceptovateľnú istú prehru získame ak dosadíme -z za w.

c> -E[z] - \frac{1}{2m} Var[z]

V tomto prípade získame possibility effect pre nízke pravdepodobnosti. EUT správne modeluje averziu voči riziku (prvá a štvrtá bunka tabuľky na strane 317). EUT nezohľadňuje možnosť vyhľadávania rizika. Vzorce pre c sa snažia variability vyvarovať. Korekcia c ide vždy v smere pozitívnej variability. Táto je maximálna pri p=0.5 a klesá smerom k extrémnym hodnotám. Odklon červenej krivky od tej zelenej ilustruje zmenu variability v závislosti od p.

Zaujímavé je zamyslieť sa nad možnými úpravami vzorca pre c tak, aby tento modeloval vyhľadávanie rizika u ľudí. Najjednoduchšie by bolo obrátiť znamienko druhého člena v závislosti od p. Ďalší prístup možno získať zvážením vychýlenia rozdelenia pravdepodobnosti výhry. Riziko nie je vždy rozdelené rovnomerne okolo očakávanej hodnoty. Napríklad pre E[w=10]=9.9 bude väčšina variability sústredená medzi hodnotami nižšími ako 9.9. (Trochu inak, ak si predstavíme opakovanú sádzku tak konfidenčný interval bude  bude širší na číselnej osi vľavo od E[w]=9.9 .) Vychýlenie rozdelenia vyjadruje túto asymetriu a je dané štvrtým členom v binominálnej postupnosti. Rozšírený model o tento člen by mohol tvoriť zaujímavý model, ktorého špecifikáciu si na tomto mieste odpustím.

Viaceré príklady, ktoré Kahneman používa ako kritiku EUT by bolo treba náležite upraviť. Napríklad na stranách 334-337 sa zaoberá reťazou rozhodnutí. Ľudia volia inak ak zadanie kombinuje reťaz úloh do jednej úlohy ako postupne riešených úlohách. Vo vzorcoch vyššie vidíme, že rozhodnutie ohľadom c závisí aj od východzej sumy m. Ak je táto nižšia sme ochotní zaplatiť viacej za poistku za vykúpenie sa z rizika. To robí aj postupné úlohy inými úlohami ako úlohy v kombinovanom probléme. Východzia suma je totiž iná. Riešenie druhého problému v sérii od sumy získanej pri predchádzajúcom probléme. Myslím, že aj v prípade hypotetických úloh môžeme u ľudí očakávať takýto vplyv.

Čo sa týka normatívnosti, tu sú podľa mňa všetky cesty otvorené. Kahneman stavia očakávanú hodnotu do roly normatívu, od ktorého sa ľudia pod vplyvom possibility a certainty efektu odkláňajú. Medián, modus, variabilita môžu tvoriť za určitých okolností dôležité indikátory. Mnohé ekonometrické modely, podobne ako EUT, zohľadňujú variabilitu a volatilitu odhadov. Konkrétnym problémom ľudí je, že zohľadňujú riziká viac než by bolo treba. To zodpovedá podhodnoteniu východiskovej sumy m. Myslím, že toto je zmysluplné vysvetlenie prípadu úzkostlivého investora. Oproti m, ktoré používa investor vo svojom bežnom živote sú sumy, s ktorými narába pri investičných rozhodnutiach obrovské. S nevhodne nízkym m sa tak investor zľakne aj nízkych rizík.

Kahneman, D. (2011). Thinking, fast and slow. Farrar, Straus and Giroux.

Lewandowsky vs. klímaskeptická blogosféra

Meno Stephana Lewandowskeho padlo už na tomto blogu v súvislosti s jeho knihou o kognitívnom modelovaní, ktorej recenzia sa tu neskôr objaví. Lewandowsky okrem matematického modelovania pamäte a kategorizácie má aj bočný záujem vo výskume konšpiračného myslenia a kognitívnych mechanizmov, ktoré podmieňujú šírenie bludov a klamov. Minulý rok mu vyšiel článok, ktorý zhŕňa všetky dôležité poznatky (Lewandowsky et al., 2012). Tento rok práve vyšiel paper študujúci popieračov klimatických zmien a ich mémplex. V situácii, keď popieranie klimatických zmien a ďalšie mýty nedostanú v akademickej tlači žiadne miesto poskytujú blogy dobré útočisko. Klímaskeptické blogy ako http://wattsupwiththat.com alebo http://climateaudit.org fungujú ako ideologické getá, kde môžu čitatelia načerpať argumenty v prospech svojho mýtu.

Lewandowsky et al. (2013a) vytvorili krátky internetový dotazník pre klímaskeptikov. Tento bol zavesený na šiestych proklíma blogoch (klímaskeptické blogy boli oslovené ale odmietli sa podielať). Celkovo ho v priebehu dvoch mesiacov vyplnilo ca. 1500 užívateľov. Lewandowsky et al. sa okrem klimatologických názorov a konšpiračného myslenia sústredili na ďalšie konštrukty. Zaujímalo ich či dotyční myslia vo všeobecnosti protivedecky a aký je súvis s podporov laissez-faire voľnotrhových názorov. Na jednej strane je možné že títo ľudia sú celkovo poverčivi a skepsa ohľadom klímy je len jedna tehlička v ich komplexom scenári celosvetovej konšpirácie. Na druhej strane títo ľudia môžu len oportunisticky hájiť svoje ekonomické záujmy. Napríklad tabakové spoločnosti a fanúšikovia tabaku v 80. rokoch odmietali výsledky vedeckých analýz ukazujúcich súvis medzi fajčením tabaku, rakovinou a ďalšími ochoreniami. Samozrejme dotyční musia nejak vysvetliť ako sa nezávislé vedecké tímy dopracovali k rovnakým nesprávnym výsledkom. Najjednoduchšie je vytvoriť si konšpiračnú teóriu, kde práca vedcov je koordinovaná nejakou tajnou organizáciou v pozadí. Ďalším častým argumentom na obhajobu ekonomických záujmov je odvolanie sa na princípy laissez-faire trhového hospodárstva. Inak povedané regulácia konzumácie tabaku je apriori zlá, lebo ako každá regulácia obmedzuje slobodu ľudí.

Klimatická politika stojí v centre silných ekonomických a mocenských záujmov. Mnohí v USA hlavne pravicovo zmýšľajúci ľudia, tak odmietajú vedecké závery. Obidva argumenty z tabakového scenára možno znovu aplikovať. Konvergenciu vedcov k rovnakým záverom treba vysvetliť. Najskôr bude dôsledkom nejakej konšpirácie. Podobne politický zákrok proti otepľovaniu bude vyžadovať nejakú formu regulácie, čim je ohrozená sloboda rozhodovania aktérov na trhu.

Vyššie sú znázornené korelácie medzi jednotlivými konštruktmi. Autori podrobnejšie analyzovali súvislosti medzi konštruktmi pomocou štrukturálnych rovníc. Výsledky ukázali že klíma skeptici systematicky odmietajú vedu a oddávajú sa konšpiračnému mysleniu. Podpora voľného trhu silne súvisí s klímaskepsou a trochu menej s protivedeckým myslením. Posledné zistenie je zaujímavé, keďže pri protivedeckom myslení sa pýtali aj či HIV spôsobuje AIDS, kde ekonomické záujmy nie sú evidentné.

Nechcem sa tu zaoberať výsledkami štúdie. Internetoví diskutéri sú stelesnené stereotypy. Stačí vidieť názory jedného, hneď poznáte názory celého ich geta a žiadny veľký výskum nie je potrebný. Sranda nastala dva mesiace po publikovaní manuskriptu štúdie, keď si ju všimli klímaskeptické blogy a začali ju dekonštruovať. Autori zbadali v situácii príležitosť a celý vývoj pomocou Googlu a ďalších nástrojov ako Alexa  podrobne monitorovali. Vskutku autori zakrátko identifikovali viacero mýtov, ktoré sa o ich štúdii začali internetom šíriť. Klímaskeptici napríklad videli štúdiu ako konšpiráciu pro-klíma diskutérov, ktorí systematicky hromadne vypĺňali dotazník, aby v následných analýzach vykreslili klímaskeptikov ako magorov. Ďalší popierali, že autori kontaktovali s dotazníkom skeptické blogy, že dáta zo štúdie boli prezentované (na konferencii) už predtým ako bol ich zber možný – a teda vyfabrikované. Keďže poradie otázok bolo náhodne generované ozvalo sa aj podozrenie, že skeptické blogy dostali iný dotazník. Objavili sa aj bizarnejšie teórie. Napríklad Lewandowského univerzitný profil bol v jeden deň z určitých krajín neprístupný, čo niektorí diskutéri vzali osobne ako cenzúru ich IP adresy vedením austrálskej univerzity. Ďalší diskutér však hneď kontroval: “Watch, they may unblock you just so they can say you are paranoid, hyper-sensitive, were never really blocked” a ďalší “If it’s true they are selectively blocking, I have to begrudgingly respect the skill with which they are playing this audience: there is no way for anyone to complain without matching the stereotypical conspiracist of the study!”.

Nakoniec sa objavili aj názory, že publikácia štúdie Lewandowského et al. (2013a) bola len návnadou, aby vyprovokovali skeptikov na reakcie, ktoré sú pravým cieľom štúdie. Zdá sa že Lewandosky et al. to zobrali s humorom a na túto konšpiračnú hru pristúpili. Ich štúdia o reakciách blogosféry na ich prvú štúdiu vyšla vo Frontiers (Lewandosky et al., 2013b) a je tohtoročným horúcim kandidátom na Ig Nobelovu cenu.

P.S. zdá sa, že Frontiers si nie je tak celkom istý finálnou verziou poslednej štúdie a pdf bol dočasne stiahnutý z webu. Nepochybne ide len o ďalšiu snahu NWO vyprovokovať konšpiračnú reakciu klímaskeptikov a tak sa môžeme tešiť na pokračovanie tejto ságy.

Lewandowsky, S., Ecker, U. K., Seifert, C. M., Schwarz, N., & Cook, J. (2012). Misinformation and its correction continued influence and successful debiasing. Psychological Science in the Public Interest, 13(3), 106-131.

Kahneman, štatistika a kauzalita

Práve čítam Kahnemanovu knihu Thinking, Fast and Slow. Niektoré aspekty si zaslúžia komentár a tento prvý článok sa zaoberá štatistickým myslením, ktoré Kahneman diskutuje hlavne v druhej časti knihy. V skratke, Kahneman (2011) zastáva nasledujúcu pozíciu. Ľudia v opantaní Systému 1 (rýchla, lenivá intuícia) nie sú schopní štatistického myslenia. Podceňujú variabilitu, zjednodušujú výpočty a výsledkom sú nesprávne predpovede a unáhlené závery. Hlavný hriech vidí Kahneman v nadmernom pripisovaní kauzálnych príčin náhodným udalostiam.

S Kahnemanovými príkladmi a interpretáciami celkom nesúhlasím. Vidím nasledujúce dva súvisiace problémy:

1. (Frekventistická) štatistika (80. rokov) je považovaná za normatívny ideál racionality – toho čoho je Systém 2 schopní a toho čo Systém 1 nerobí.

2. Nie je jasné či probanti interpretujú inštrukcie a otázky tak ako ich interpretujú Kahneman resp. štatistika.

Začnime príkladom z úvodnej kapitoly:

Váš sused vám popísal nasledujúcu osobu: “Števo je veľmi ostýchavý a uzavretý, vždy nápomocný avšak s slabým záujmom o spoločnosť a sociálne činnosti. Tichá a puntičkárska duša, rád má poriadok a systematickosť” Je Števo s vyššou pravdepodobnosťou knihovník alebo farmár? (Kahneman, 2010, s. 7)

Ľudia odpovedajú, že knihovník, keďže popis osoby lepšie sedí na knihovníka. Tento záver je podľa Kahnemana mylný, keďže knihovníkov je oveľa menej ako farmárov. Vyjadrené Bayesovou vetou p(F|E) = p(E|F) p(F) a p(K|E) = p(E|K) p(K), kde F znamená, že Števo je farmár, K knihovník, E je evidencia teda vyššie uvedený popis Števa. Probanti zrejme modelujú p(S=F)=p(S=K)=0.5 a zamieňajú p(F|E) s p(E|F), čo je nesprávne.Správne riešenie je dané Bayesovou vetou a apriórne pravdepodobnosti by mali prebiť evidenciu danú nejasným popisom.

Predstavte si, že by sa vás známy spýtal podobnú otázku, alebo že by ste ju dostali ako pokusný králik v psychologickom experimente. Odpovedali by ste inak ak by ste vedeli, že p(F)>>p(K) a poprípade táto znalosť bola súčasťou zadania. Ja by som odpovedal rovnako a apriórne frekvencie by som nezohľadnil. Naopak niekoho, kto by prišiel s odpoveďou že farmár, lebo vyššia apriórna pravdepodobnosť by som vnímal ako protivného chytráka, ktorý mi nechce zodpovedať jednoduchú otázku. Inak povedané odpoveď s pomocou apriórnych frekvencii nie je správnou odpoveďou, lebo otázku ľudia čítajú inak. Ľudia čítajú zadanie kauzálne – Štefanove osobnostné črty vedú k výberu zamestnania. Kauzálne interpretácie nám lepšie umožňujú interpretovať udalosti a úspornejšie ukladať vedomosti o nemenných pravidelnostiach v našom okolí. Ako píše Pearl (2009, s.182) “humans are generally oblivious to rates and proportions (which are transitory) and they constantly search for causal relations (which are invariant). Once people interpret proportions as causal relations, they continue to process those relations by causal calculus and not by the calculus of proportions.”

Bayesiánske siete útočia

Krynski & Tenenbaum (2007) ukázali, že ľudské posudky pravdepodobností je naozaj lepšie modelovať pomocou kauzálnych bayesiánskych sietí a la Pearl (2009). Podľa autorov ak sa ľudí spýtame na pravdepodobnosti ľudia neposudzujú aposteriórnu p(F|E) a p(K|E), ale pravdepodobnosť manipulácie, teda zmeny Štefanovho zamestnania. Dva scenáre a) “Štefan je knihovník” a b) “Štefan je farmár” vyjadrujú dva rôzne kauzálne grafy.

Probanti následne porovnajú pravdepodobnosť obidvoch grafov t.j. p(F,E,K) pre obidva modely. Pre graf a) p(F,E,K)=p(F)p(E)p(K|E) a pre graf b) p(F,E,K)=p(F|E)p(E)p(K). Ak členy prehádžeme zistíme, že graf a) – Štefan je knihovník je pravdepodobnejší ak aposteriórny pomer p(K|E)/p(F|E) > p(K)/p(F). Keďže popis výborne sedí na knihovníka, pravdepodobnosť, že popísaná osoba je knihovník je vyššia ako pravdepodobnosť, že náhodne vybraná osoba je knihovník, teda p(K|E)>p(K). V prípade že p(F|E) je rovné alebo dokonca menšie ako p(F) je graf a) pravdepodobnejší. Tento výpočet dobre zodpovedá našim intuíciám.

Zoberme si ďalší príklad z 15. kapitoly.

“Linda je 31 ročná, single, priamočiara a chytrá. Vyštudovala filozofiu. Ako študent sa zaujímala o problémy diskriminácie a sociálnu spravodlivosť a zúčastnila sa aj demonštrácii proti atómovej energii.”

Ktorá z nasledujúcich možností je pravdepodobnejšia?
a) Linda pracuje v banke.
b) Linda pracuje v banke a je členom feministického hnutia.

Väčšina ľudí vrátane mňa zvolí b). Pritom platí, že pravdepodobnosť zložených udalostí nemôže byť väčšia ako pravdepodobnosť jednoduchých udalostí. Logicky, počet ľudí, ktorí pracujú v banke a sú zároveň členmi feministického hnutia (BF) musí byť menší/rovný ako počet ľudí, ktorí pracujú v banke (B). BF je totiž podmnožina B. Tým pádom musí byť aj frekvencia a pravdepodobnosť udalosti b) nižšia ako a).

Intuitívne, čo ovplyvňuje naše nesprávne rozhodnutie je pravdepodobnosť že Linda je feministka v závislosti od popisu D, teda p(F|D). Tento popis totiž na feministku výborne sedí. Takisto výrok a) nám implikuje že Linda nie je členkou feministického hnutia lebo a) takto stojí v kontraste k b). Ľudia intepretujú otázku pravdepodobnejšej možnosti kauzálne a miesto aby porovnali p(BF|D) s p(B|D) porovnávajú pravdepodobnosť dvoch kauzálnych modelov p(M1) a p(M2), ktorých grafy vyzerajú nasledovne:

Pravdepodobnosti modelov sú znova dané ako zložená pravdepodobnosť všetkých premenných v modele p(F,D,B). Pre M1 platí p(M1)= p(F)p(D)p(B|D). Pre M2 platí p(M2)=p(F|D)p(D)p(B|D). Vidíme že aby sme porovnali pravdepodobnosť oboch modelov stačí nám porovnať p(F|D) a p(F). Ostatné členy sú rovnaké pre p(M1) a p(M2).  Apriórna pravdepodobnosť, že náhodne vybraná osoba je feministka p(F) je nízka. Oproti tomu, pravdepodobnosť že osoba s popisom D je feministka je vysoká, teda p(F|D)>p(F) a zvolíme b) presne ako nám intuícia káže. Kauzálnu analýzu možno predeklinovať na ostatné Kahnemanove príklady a zistíme, že k ľudským intuíciám sedí ako šerbeľ na zadok. Vyskúšajme si to.

Ktorá z alternatív je pravdepodobnejšia?

Linda má vlasy.

Linda má blond vlasy.

V tomto prípade sa ľudia nedopúšťajú omylu. Kahneman to vysvetluje tým že podobnosť popisu s feministkou má vysokú plauzibilitu/reprezentatívnosť, takže probanti ignorujú všetky ostatné informácie. Naproti tomu blond vlasy takúto vysokú plauzibilitu nezdieľajú. Linda môže byť kľudne aj bruneta. Obidva príklady pritom majú rovnakú logickú štruktúru. Príklady však nemajú rovnakú kauzálnu štruktúru. Grafy sú znázornené nižšie. B znamená “jej vlasy sú blond” a V “má vlasy”.

Trik je v tom, že V kauzálne ovplyvňuje B – a to veľmi silne, deterministicky. Ten, kto nemá vlasy nemôže mať blond vlasy. Tým sa mení štruktúra problému. Ak chceme porovnať M1 a M2 musíme porovnať p(B|V) a p(B|V,D). Toto porovnanie nie je ľahké keďže dodatočne závisí od V. Ak napríklad Linda nemá vlasy vieme, že nemá blond vlasy a teda p(M1)=p(B|V)=p(B|V,D)=p(M2).

Intuícia nám však hovorí že M1 je jednoznačne pravdepodobnejšie ako M2. Táto intuícia zodpovedá porovnaniu modelov M3 D \rightarrow V a M4 D \rightarrow B a platí p(V)>p(B).

Že v Kahnemanových príkladoch nejde o plauzibilitu/reprezentatívnosť možno ilustrovať pridaním šípky medzi Lindinimi feministickými záujmami a jej povolaním. Resp. táto šípka tam už je, avšak korelácia je negatívna – feministky najskôr nebudú pracovať v korporačnom kapitalistickom bankovom sektore. Môžeme si však upraviť príklad a Lindu zamestnať v kvetinárstve alebo v neziskovke a intuitívna pravdepodobnosť b) ku a) rapídne klesne. Pritom súvis medzi feminizmom a popisom zostal nezmenený, rovnako plauzibilný a teda podľa Kahnemana by sa ani hodnotenie nemalo meniť.

Problémom všetkých týchto Kahnemanových príkladov je že zatiaľčo pravdepodobnosti sú v zadaní dané, kauzálna štruktúra problému nie je určená. Tým pádom bayesiánske kauzálne modely netvoria jasné predpovede a nie je možné kauzálne modely jasne a priamo porovnať s Kahnemanovou teóriou. Krynski & Tenenbaum (2007) vo svojom štvrtom experimente manipulovali kauzálnu štruktúru zatiaľčo pravdepodobnosti ostali rovnaké. Príbeh k experimentu bol nasledovný.

S1: CIA zložila tím agentov. Misia vyžaduje nasadenie žien takže účasť žien v tíme je pravdepodobnejšia. Vskutku väčšina agentov v tíme sú ženy. Keďže ženy sú všeobecne nižšie, väčšina agentov v tíme je nižšia ako 170 centimetrov.

Q: Do tímu sa dostalo aj zopár mužov. Myslíte že títo budú nižší, rovnakí alebo vyšší ako priemerný muž?

Iná skupina probandov musela posúdiť Q na základe S2 :

S2: CIA zložila tím agentov. Misia vyžaduje nasadenie nízkych ľudí takže účasť nízkych ľudí v tíme je pravdepodobnejšia. Vskutku väčšina agentov sú nižší ako 170 cm. Keďže ženy sú všeobecne nižšie, väčšina agentov v tíme sú ženy.

Intuitívne odpovede sú S1 “rovnakí” a S2 “vyšší”, čo zodpovedá predpovediam kauzálnemu modelu. Pri S1 pritom ignorujeme informáciu že pravdepodobnosť člena tímu byť výšky nad/pod 170 cm je 50:50 a teda priemer je na mužský štandard skôr nízky. Z pohľadu kauzálneho modelu sa odpoveď mení lebo mechanizmus výberu agentov je iný. Z Kahnemanovho pohľadu sú S1 aj S2 rovnaké, keďže pravdepodobnosti sú rovnaké (a takisto oba príklady obsahujú rovnaké množstvo kauzálnej príbehovej omáčky). Tým pádom by aj odpovede probandov mali byť rovnaké. (Autori navyše prehodili aj otázky takže ďalšie dve skupiny posudzovali pravdepodobnosť pohlavia vysokých členov tímu. Výsledky boli opačné – S1 “skôr muži”, S2 “rovnakí”, tak ako kauzálny model predpovedá.)

Kahneman o kauzalite

Kahneman rozoberá vplyv kauzálneho úsudku na odpovede probantov v 16. kapitole. Kahneman súhlasí, že posudzovanie kauzality hrá rolu avšak jeho táto koncepcia je diametrálne odlišná od predstáv Tenenbauma a Pearla popísaných vyššie. Podľa Kahnemana sú probandi schopní správnej interpretácie štatistiky ak im ju zabalíme do kauzálneho príbehu. Podľa Tenenbauma kauzálny príbeh je nevyhnutnou súčasťou problému. Riešenie nie je definované ak nie je probandom daná kauzálna štruktúra. V úlohách vyššie probanti blahosklonne doplnia, čo experimentátor zo zadania vynechal. Väčšinou sa jedná o banálne kauzálne fakty – osobnosť spôsobuje výber povolania a nie naopak, minulosť ovplyvňuje budúcnosť a nie naopak… V prípade ak kauzálna štruktúra stojí v konflikte so štatistickou informáciou v inštrukcii (napríklad je dané p(K), ale kauzálny graf káže p(K|E)), tak probanti túto informáciu samozrejme ignorujú. Kauzálne vysvetlenie netvorí žiadnu nepodstatnú príbehovú omáčku, ktorej jediným cieľom je nakopnúť lenivý Systém 1. Kauzálna informácia je dôležitou súčasťou ľudských problémov bez ktorej tieto nie sú riešiteľné. Ako som citoval vyššie Pearla kauzálna interpretácia vedie k lepšiemu výberu dôležitých pravidelností, ktoré ostávajú konštantné. Tieto kauzálne pravidelnosti sa oplatí ľuďom zapamätať a komunikatívne šíriť. Preto aj naša komunikácia uprednostňuje kauzálnu interpretáciu. Keď kauzálna interpretácia vedie k zlým výsledkom, je to väčšinou v exotických prípadoch keď kauzálny súvis nie je očividný (napr. pri onkologických diagnózach) alebo v úlochách štatistikov a v experimentoch psychológov, ktorí si dôležitosti kauzálnej informácie nie sú vedomí.

Skryté súvislosti

Chcem ešte diskutovať zopár príkladov, kde nie je problematická kauzálna štruktúra ale štatistický model, ktorý Kahneman predpokladá ako normatív. V príklade na strane 160 probanti hodnotili dve sady produktov rovnakej kvality vo výpredaji. V sade A bolo 10 produktov, všetky bez chyby. V sade B bolo 10 bezchybných produktov + 2 poškodené produkty. Koľko ste ochotný zaplatiť za sadu A a koľko za sadu B? Vedci zistili že probanti sú ochotní zaplatiť viac za sadu A ak sú im ponuky predstavené jednotlivo. Ak im predstavia obidve ponuky bok po boku, tak probanti zvolia B. Kahneman poznamenáva, že štruktúra tohoto problému je podobná problémom uvedeným vyššie. Kahneman vychádza z toho že hodnoty sád h(A) a h(B) sú rovnaké nezávisle od spôsobu akým produkty predstavíme. Ak však postavíme produkty bok po boku musíme hodnotiť h(A|B) a h(B|A), teda hodnotu sady ak viem o ďalšej sade. Vskutku, zadanie implikuje h(A|B)<h(A).

Poznatok, že dva produkty sú poškodené vrhá zlé svetlo na kvalitu ostatných produktov v sade. Napríklad môžeme očakávať, že aj tieto obsahujú poškodenia v menšej miere a predajca nám ich zatajil, alebo môžeme predpokladať, že pravdepodobnosť, že sa produkt pokazí je vyššia (keďže dva sa pokazili ešte počas skladovania v obchode). Tak je tomu v prípade sady B predstavenej samostatne. Sada ktorá nedeklaruje pochybné produkty žiadne takéto podozrenie nevzbudzuje. To je prípad sady A predstavenej samostatne. Ak probanti vidia obidve ponuky vedľa seba a zadanie im hovorí že produkty v obidvoch sadách sú rovnakej kvality tak znalosť chybných produktov v sade B vrhá zlé svetlo nielen na produkty v sade B ale aj na produkty v sade A. Probanti tak pri tomto spôsobe prezentácie uprednostnia sadu B, ktorá ponúka oproti A vyššiu kvantitu nízkej kvality.

Druhý  príklad tvorí Kahnemanov experiment zo 16. kapitoly. Zadanie:

Taxík bol zapletený do nočnej dopravnej nehody a ušiel z miesta činu. Dve Taxi služby prevádzkujú v meste taxíky odlišnej farby – modré a zelené. 85% taxíkov je zelených a 15% je modrých. Svedok nehody identifikoval unikajúci taxík ako modrý. Súd testoval spoľahlivosť svedka a zistil, že svedok v 80% prípadov určil farbu taxíka správne a nesprávne v zvyšných 20% prípadov. Aká je pravdepodobnosť, že taxík zapletený do nehody bol skôr modrý ako zelený. (s. 166)

Probanti spáchajú intuitívny hriech – ignorujú nižší apriórny počet modrých taxíkov a v priemere odpovedajú 80%, čo zodpovedá spoľahlivosti svedka. Je však možné, že probanti vychádzajú z toho, že svedok je schopný zohľadniť apriórnu pravdepodobnosť taxíkov a teda že jeho úsudok je už očistený o tieto apriori poznatky. Vskutku v psychológii máme dobrú evidenciu, že vizuálne vnímanie ovplyvňujú top-down aj kognitívne faktory. V našom príklade (kľudne aj implicitná) znalosť relatívnej frekvencie zelených a modrých taxíkov môže viesť k tomu, že človek bude skôr halucinovať zelené taxíky. Krynski a Tenenbaum (2007) testovali túto hypotézu tým že upravili zadanie. Komplikujúci faktor netvorila nespoľahlivosť svedka ale fakt že 20% zelených taxíkov vyzeralo ako modré a 20% modrých ako zelené (dôvod: ošúchaná farba). V tomto prípade je svedok sto-percentne spoľahlivý a teda probanti musia dodatočne zvážiť aj apriórne frekvencie taxíkov. V tomto experimente probanti zohľadnili základné frekvencie modrých a zelených taxíkov.

Frekventistická štatistika ako normatívny štandard

Zopár Kahnemanových pozorovaní sa týka historických špecifík frekventistickej štatistiky – jej aplikácie a interpretácie. Tieto príklady skôr demonštrujú zlyhania frekventistickej štatistika ako zlyhania kognitívne. Kahneman sa v desiatej kapitole odvoláva na fakt, že psychológovia a vedci používajú moc malé vzorky vo svojich štúdiách – moc malé na to, aby získali signifikantné výsledky. Podľa Kahnemana sú na vine ich intuície a ani roky tréningu na tom nič nezmenili. Vtip je v tom, že psychológovia naozaj nechcú získať signifikantné výsledky. V psychológii súvisí všetko so všetkým a každý takýto efekt sa stane signifikantným pri dostatočne veľkej vzorke. Zároveň psychologické štúdie neštudujú jeden takýto efekt ale celú radu rôznych experimentálnych variácii s viacerými závislými a nezávislými premennými. Ak by psychológovia naozaj použili adekvátnu vzorku získali by neinterpretovateľnú armádu signifikantných efektov. S nízkou vzorkou získajú psychológovia len jeden, dva signifikantné efekty. Nesignifikantné výsledky sú interpretované ako žiadny rozdiel. Následne nie je ťažké k týmto dvom efektom vymyslieť teóriu, takže výsledky sú koherentné a publikovateľné (aj keď zrejme náhodné). Psychológovia teda veľmi dobre vedia čo robia, keď používajú neadekvátne vzorky. Malé vzorky tvoria optimálnu publikačnú stratégiu (Maxwell, 2004).

Kahneman sa ďalej odvoláva na štúdiu, kde testovali s Amosom Tverskym štatistické vedomosti členov americkej Society of Mathematical Psychology. Títo predviedli nechýrny výkon a dopustili sa viacerých omylov. Aj v tomto prípade si nemyslím, že na vine boli mylné intuície. Úlohy sa týkali hlavne frekventistickej štatistiky, ktorá je neintuitívna, mnohé jej koncepty sú nejasné a aj experti sa hádajú o ich interpretácii. Ďalším faktorom je týkajúcim sa konkrétne psychológov je, že výučba štatistiky v psychológii v 50.-80. rokoch zlyhala – viaceré učebnice šírili mylné koncepty a definície a viedli k nesprávnej aplikácii a interpretácii štatistických metód (Gigerenzer, 1992, 2004). Intuície v tomto zmätku zrejme hrali rolu. Môžeme však hovoriť o bayesiánskych intuíciách, ktoré síce vo frekventistickej štatistike nemajú miesto, avšak súčasný vzostup bayesiánskej štatistiky ich do veľkej miery validuje. Napríklad, Kahneman poukazuje na to, že sériu hodov mince HHHH vnímame ako menej pravdepodobnú ako HKKH. Technicky vzaté sú pri tom obidve série rovnako pravdepodobné s p = 2^{-7}. Ako ďalší príklad uvádza Kahneman miesto dopadov bômb na Londýn počas druhej svetovej vojny. Podľa viacerých vtedajších pozorovateľov tieto miesta vykazovali vzory a šetrili oblasti, kde boli umiestnení nemeckí špióni. Neskoršia štatistická analýza preukázala, že miestá dopadov bômb sú náhodné. Obidva tieto príklady diskutuje a testuje štúdia Griffithsa a Tenenbauma (2007), o ktorej som už písal na Mozgostrojoch. Aj v tomto prípade hrá kauzalita dôležitú rolu. V skratke, títo autori ukázali, že odhady pravdepodobností u probantov je lepšie interpretovať ako odhady kauzálnej náhodilosti, t.j. či známy kauzálny mechanizmus vplýva alebo nevplýva na pozorovania. Griffiths a Tenenbaum ukázali, že odpovede probantov zodpovedajú predpovediam bayesiánskeho modelu kauzálnej náhodilosti. Kauzalita je tradičným tabu vo frekventistickej štatistike a tak nečudo, že frekventistické modely nie sú schopné popísať odpovede ľudí.

Čo zostalo?

Vyššie som uviedol alternatívne vysvetlenia pre výsledky experimentov. Na výsledkoch experimentov to samozrejme nič nemení. Pozorované fenomény sú tie isté a prešli mnohými replikáciami. V prípade niektorých experimentov však nie je ich výpovedná hodnota zrejme taká vysoká ako sa Kahneman domnieva. Inštrukcia v týchto experimentoch nie je jednoznačná a umožňuje vplyv faktorov (t.j. apriórne kauzálne predstavy pomocou, ktorých probanti zadanie interpretujú), ktoré by dobrý experiment mal kontrolovať alebo aspoň merať.

Bayesiánske kauzálne modelovanie nič nemení na tom, že ľudia sa dopúšťajú spomínaných “chýb”. Akurát ukazujú, že zdrojom týchto chýb nie je v bias alebo nejaká nesprávna heuristika ale zlé zadanie problému. Alternatívne preto musíme najprv ujasniť ako chceme problém kauzálne modelovať a pokúsiť sa sprostredkovať túto kauzálnu štruktúru cieľovému publiku. Ak dochádza k nedorozumeniam treba ujasniť čí naše publikum problému pripísalo tú správnu štruktúru a ak nie, v ktorých aspektoch kauzálneho grafu sa reprezentácie líšia. Zatiaľčo Kahneman len vágne hovorí o kauzálnych schémach, reprezentatívnosti a plauzibilite (pojmy, ktoré fenomény skôr post-hoc označujú než vysvetľujú), kauzálny prístup umožňuje určiť v ktorých prípadoch vznikajú nedorozumenia a ako tieto nedorozumenia odstrániť.

Na záver treba dodať, že Kahneman uvádza aj príklady, kde sa s ním dá súhlasiť, že ide o zlyhania intuície. Konkrétne sa jedná o Gamblers Fallacy, regresia k priemeru a príbuzné situácie, kde je opakujúcim sa nezávislým javom pripisovaný kauzálny súvis. Kahneman uvádza príklad viery basketbalistov v existenciu horúcej ruky. Mnohí basketbalisti veria, že séria úspešných pokusov zvýšuje následnú úspešnosť hodov. Spoločnou súčasťou týchto príkladov je časová následnosť. Čas je silným zdrojom kauzálnej informácie, keďže vieme že minulosť je nezávislá od budúcnosti. Tým pádom ak sú dve časovo postupné udalosti korelované môžeme vylúčiť že budúca udalosť ovplyvňuje tú minulú a opačný mechanizmus sa nám ponúka ako vysoko plauzibilný. Uniká nám tým však možnosť že obidve udalosti nemusia byť sú podmienené priamo ale ich korelácia môže byť sprostredkovaná tretím faktorom. Pearl (2009) diskutuje tieto prípady. Aj keď uznáva že prílišná ochota uvidieť kauzalitu môže viesť pri nezávislých časovo následných udalostiach k ilúziám, aj v pri týchto iluzórnych prípadoch môžeme nájsť dobré dôvody prečo zariskovať. Minulé hody mince nám nepovedia nič o pravdepodobnosti tých budúcich. Uváženie tejto kauzálneho súvisu nám môže pomôcť zistiť či minca nie je upravená, alebo naopak nám môže vnuknúť nápad mincu upraviť a využiť túto znalosť vo svoj prospech [Edit 1/4/2013: doplňujem citát]:

It is the nature of any causal explanation that its utility be proven not over standard situations but rather over novel settings that require innovative manipulations of the standards. The utility of understanding how television works comes not from turning the knobs correctly but from the ability to repair a TV set when it breaks down. Every causal model advertises not one but rather a host of submodels, each created by violating some laws. The autonomy of the mechanisms in a causal model thus stands for an open invitation to remove or replace those mechanisms, and it is only natural that the explanatory value of sentences be judged by how well they predict the ramifications of such replacements. (s. 220)

Na LessWrong písali, že filozofi by mali študovať Kahnemana a Pearla namiesto Kanta a Platóna. Ja môžem len dodať, že (aspoň čo sa týka teoretizovania) psychológovia by mali študovať Pearla namiesto Kahnemana. Hierarchia vied nepustí.

Literatúra
Gigerenzer, G. (1992). The superego, the ego, and the id in statistical reasoning. A handbook for data analysis in the behavioral sciences: Methodological issues, 311-339.
Gigerenzer, G. (2004). Mindless statistics. Journal of Socio-Economics, 33(5), 587-606.
Griffiths, T. L., & Tenenbaum, J. B. (2007). From mere coincidences to meaningful discoveries. Cognition, 103, 180-226.
Kahneman, D. (2011). Thinking, fast and slow. Farrar, Straus and Giroux.
Krynski, T. R., & Tenenbaum, J. B. (2007). The role of causality in judgment under uncertainty. Journal of Experimental Psychology General, 136(3), 430.
Maxwell, S. E. (2004). The persistence of underpowered studies in psychological research: causes, consequences, and remedies. Psychological methods, 9(2), 147.
Pearl, J. (2009). Causality: models, reasoning and inference (2nd ed.). Cambridge University Press. Cambridge, UK.

Nate Silver: Signal and Noise

Silvera najskôr budete poznať v súvislosti s tohtoročnými americkými prezidentskými voľbami. Pomocou štatistických modelov (a s trochou šťastia) sa Silverovi podarilo na svojom blogu pre NY Times predpovedať výsledky voľby vo všetkých amerických štátoch a tým celkovú pohodlnú výhru pre Obamu. Silverove predpovede stáli v kontraste s vyjadreniami politických analytikov, ktorý očakávali tesný výsledok. Silver sa stal obeťou nevyberavých útokov zo strany republikánskych politických komentátorov (k čomu zrejme prispelo aj, že Silver je homosexuál). Silver ponúkol svojim kritikom aby sa stavili o peniaze, za čo sa mu dostalo kritiky od editorky NY Times. (Alex Tabbarok sa Silvera zastal a pri tejto príležitosti vypustil bonmot, že stávkovanie je daňou na nezmysli “A Bet is a Tax on Bullshit”.) Výsledky volieb však dali Silverovi za pravdu.

Zhodou okolností na jeseň 2012 vyšla Silverovi jeho prvá populárno-vedecká kniha s názvom “Signal and Noise: Why so many predictions fail – but some don’t“. Silver vyštudoval ekonómiu a po štúdiu pracoval ako analytik pre jednu účtovnícku firmu. Job ho moc nebavil a vo voľnom čase vyvinul štatistický program PECOTA, ktorý predpovedal štatistiky baseballových hráčov a v konečnom dôsledku ich hodnotu a úspešnosť tímov za ktoré hrajú. Neskôr svoj program odpredal a istý čas sa živil hraním pokeru. V súvislosti s plánovaným legislatívnym zákazom hrania online pokeru sa Silver začal zaujímať o politiku. Čoskoro zistil, že úroveň politických analýz je mizerná a empirický štatistický prístup by ponúkol o triedu úspešnejšie predpovede. Od roku 2007 tak začal Silver analyzovať politické predpovede.

Kniha dnes 34 ročného Silvera vychádza z jeho bohatej skúsenosti a zaoberá sa úspechmi a limitmi štatistických analýz. Jedným z hlavných leitmotívov jeho knihy je, že naše každodenné intuície a biasy nás obmedzujú pri tvorbe realistických predpovedí. Toto je najlepšie vidieť v politike, baseballe a ekonómii, kde predpovede takzvaných expertov sú mnohokrát úplne vedľa. Hlavným problém kvalitatívnych ľudských expertných analýz je že tieto nemyslia probabilisticky. Odhady bez zváženie neistoty – t.j. variability predpovedaných hodnôt sú neúplné. Toto môže viesť k fatálnym následkom, napríklad keď vedci predpovedali, že úroveň hladiny rieky dosiahne 49 palcov a teda nepresiahne 51 palcov vysokú hrádzu. Pritom zahrnutie variability odhadu by umožnilo zistiť, že pravdepodobnosť, že hladina prekročí hrádzu je až 30 percent a teda treba vykonať ďalšie opatrenia na posilnenie hrádze. Podobne, hrozivé správy o prekvapivom prepade ekonomiky oproti predpovediam o desatinu percentuálneho bodu sú bogus keďže očakávaná odchýlka samotných odhadov je oveľa viac ako 0.1.

Nie všade je však štatistický prístup zaručenou spásou. Problém tvoria nedostatočné dáta, ktoré neumožňujú zovšeobecnenia a takisto nedostatočná znalosť kauzálnych procesov, ktoré tvoria dáta. Takto je tomu v prípade predpovedí zemetrasení, chrípkových epidémii a makroekonomických indikátorov (napr. nezamestnanosť alebo inflácia). Silver naopak prezentuje úspešný príbeh predpovedania počasia, kde veda zaznamenala obrovský pokrok. Vďaka množstvu dát a schopnosti počítačovo vyhodnotiť komplexné modely sa zlepšila presnosť predpovedí počasia. Obzvlášť pozoruhodný je prípad predpovede hurikánov. Vedci sú dnes schopní predpovedať príchod hurikánu 3 dni dopredu s presnosťou ca. 100 míl, čo umožňuje zmysluplnú evakuáciu. Pred 40 rokmi vedeli vedci určiť oblasť v rozsahu 300 míl 24 hodín dopredu.

Silverovou druhou nosnou témou je, že počítače samy o sebe nám nezaručia presné predpovede. Ideálnou stratégiou je kombinovať štatistické metódy s ľudskou kreativitou a flexibilitou pri rozhodovaní. Tento bod mi nie je celkom jasný. Silver totiž formuluje svoju pozíciu ako kritiku frekventistickej štatistiky. Silver uprednostňuje bayesiánsku štatistiku, ktorá umožňuje lepšie kombinovať subjektívne vedomosti so štatistickou inferenciou. Skôr mám dojem, že Silverov kontrast vystihuje rozdelenie Christophera Bishopa ML aplikácii na tri generácie. Tretia generácia čerpá z bayesiánskej štatistiky a aplikácie umožňujú zahrnúť subjektívne doménovo špecifické poznatky do predpovedí. Druhú generáciu tvoria black-box algoritmy ako SVM a neurónové siete a prvú generáciu tvorí GOFAI. Silver sa v knihe zaoberá víťazstvom Deep-blue nad Kasparovom ku konci minulého storočia. Silver vyzdvihuje, že deep-blue bol úspešný práve vďaka tomu, že programátori zakomponovali do výpočtov množstvo šachových znalostí.

Silverova snaha kritizovať frekventistov, následne triafa mimo a viacerí štatistici už jeho knihu za to kritizovali. Výzvou by Silverovi mali byť oblasti kde 2. generácia exceluje. Napr. rôzne algoritmy sú schopné dekódovať mozgové signály v reálnom čase. Za týmito úspechmi nestoja lepšie meracie prístroje ale práve lepšia štatistika a lepšie algoritmy. Silver tieto oblasti opomína. V konečno dôsledku sa mi tak zdá, že knihu je lepšie vidieť ako prehľad zaujímavý prípadov modernej aplikácie štatistiky. Tieto moc nesúvisia a tvoria koláž na spôsob Freakonomics. Silver sa nakoniec snažil knihe dodať ucelenú myšlienku čo mu ale moc s jeho stavaním sa do pozície bayesiána nevyšlo.

Odhliadnúc od týchto viacmenej akademických polemík, som nadšený z toho, že štatistické myslenie sa vďaka Silverovej knihe dostane do širšieho povedomia. Musíme, si uvedomiť, že všetky predpovede nevyhnutne zahŕňajú určitú mieru neistoty. Pri politických prieskume sa musíme pýtať aké je rozhranie v ktorom môžeme na základe výsledkov s istotou lokalizovať popularitu strany alebo politika. Predpovede rastu HDP, nezamestnanosti alebo inflácie sú takisto stanovené s určitou presnosťou. Je rozdiel či očakávam priemerný rast HDP 1.4 pri intervale 1.3 až 1.5 alebo 0.9 až 1.9 percent. Až znalosť presnosti odhadu nám umožní vyhodnotiť jej úspešnosť. V prípade predpovedí klimatických zmien môže nesprávne chápanie predpovedí viesť k dojmu, že tieto sú nepresné, keďže nepredpovedali zmeny teploty do poslednej desatiny stupňa Celzia a tým diskreditujú celú klimatológiu. Nakoniec v oblasti hier a stávkovania môže byť probabilistické myslenie obrovskou výhodou. Trochu, paradoxne najviac ho zúžitkujete práve v konkurencii ignorantov, ktorých predpovede a stávky trpia ilúziou istoty. Poznatky zo Silverovej knihy tak môžno najlepšie aplikovať práve v izolovanej intelektuálnej púšti akou je stredozem. Do toho!