Jaynes: Probability Theory, Kapitola 5

Obsah piatej kapitoly označil Jaynes ako neobvyklé (queer) aplikácie teórie pravdepodobnosti. Táto kapitola tvorí ilustráciu a diskusiu bayesiánskeho testovania hypotéz, ktoré Jaynes predstavil v štvrtej kapitole.

Frekventistickú tradíciu tvoria dva hlavné prúdy reprezentované R.A. Fischerom na jednej strane a Jerzy Neymanom na strane druhej. Spor medzi týmito dvoma tradíciami sa týka práve testovania hypotéz. Pedľa Neymana potrebujeme na to aby sme vyvrátili nulovú hypotézu sformulovať alternatívnu hypotézu. Podľa Fischera môžeme nultú hypotézu len falzifikovať a alternatívnu hypotézu na to nepotrebujeme. Bayesiáni v tomto ohľade súhlasia s Neymanom. Testovanie hypotéz je relatívne a pravdepodobnosť hypotézy vždy závisí od ostatných zvažovaných hypotéz.

Jaynes ilustruje problém testovania bez zváženia alternatívnej hypotézy na prípade parapsychologického výskumu. V jednom experimente na začiatku minulého storočia demonštrovala Gloria Stewartová jasnozrivosť, keď uhádla 9410 z 37100 (25.3 percent) kariet správne. Pritom náhodné hádanie (nulová hypotéza) by viedla v danom experimente k úspechu pri 1/5, čo tvorí 7420 úspešných ťahov so štandardnou odchýlkou 77 ťahov. Zástancovia mimo-zmyslového vnímania vyrátali , že pravdepodobnosť nulovej hypotézy je 10 na -139. Pravdepodobnosť náhodného hádania je teda mizivá.

Táto interpretácia je problematická z nasledujúcih dôvodov. Pravdepodobnosť nulovej hypotézy závisí od počtu hypotéz. Napríklad pri jednom vrhu mincou mám dve hypotézy H (0.5) a Z (0.5). Pri dvoch vrhoch tri HH, HZ, ZZ (0.25,0.5,0.25). Čím väčší počet hypotéz máme tým nižšia je pravdepodobnosť respektívnych hypotéz. V prípade jasnozrivej pani tvorí množinu hypotéz pravdepodobnosť úspešných predpovedí, čo je hodnota v rozmedzí 0 až 1. V prípade, že zoberieme docielený úspech 25.3 ako alternatívnu hypotézu, pravdepodobnosť tejto hypotézy nie je obzvlášť vysoká – 0.00476. Musíme teda posúdiť vzájomnú pravdepodobnosť hypotéz a presne to má za cieľ bayesiánske testovanie. V tomto prípade to ale na výsledku nezmení keďže pravdepodobnosť nulovej hypotézy je mizivá. Otázkou je však akú hodnotu máme zvoliť pre alternatívnu hypotézu pred tým než zozbierame naše dáta.  Ak napríklad zvolíme alternatívnu hypotézu že pani Stewartová bude úspešná v polovici prípadov, tak pozorovaná 25.3 úspešnosť podporí našu nulovú hypotézu. Tieto problémy s vyhodnocovaním parapsychologického výskumu sa objavujú stále znova. V najnovšom prípade Bemovej štúdie sa kritika Wagenmakers a kolegov točila hlavne okolo tohotu bodu. Akú alternatívnu hypotézu chceme stanoviť pre Bemove experimenty? Problémom parapsychologického výskumu je že pozorované efekty sú slabé až mizivé. To platí aj v porovnaní so silou efektov, ktoré tradične pozorujeme v psychologických štúdiách. Každopádne špecifikovanie alternatívnej hypotézy zvýši pravdepodobnosť nulovej hypotézy.

Jaynes ale ponúka ďalšie vysvetlenie, prečo parapsychologickým výsledkom neverí. Výsledky sú totiž sprostredkované experimentom – jeho dizajnom, prevedením a experimentátormi. Musíme teda zvážiť pravdepodobnosť možnosti, že došlo k pochybeniu alebo podvodu. Možností ako k takýmto pochybeniam a podvodom možno dojsť sme videlo dosť aj na tomto blogu. Každá z týchto možností sa zdá byť apriori pravdepodobnejšia ako jasnovidectvo pani Stewartovej. Tieto alternatívne hypotézy procesu vzniku dát sa akumulujú a dokopy tvoria skeptické apriórne presvedčenie, ktoré nemôže v podstate prebiť žiadna evidencia z parapsychologických experimentov. To neznamená, že sme apriori presvedčení a nemožnosti jasnovidectva. Akurát má jeden dobre prevedení experiment (napr. pod taktovkou skeptického publika) vyššiu vierohodnosť ako desať zle prevedených. Žiaľ je tomu tak (c.f. Bem), že aj súčasná psychologická metodika má nedostatky, takže sa v prípade jasnovidectva radšej namiesto psychologických experimentov spoľahneme na výsledky našich kolegov fyzikov.

Jaynes ilustruje, že bayesiánska štatistika dokážu zahrnúť sprostredkovanosť informácie do modelov. Tým je možné vysvetliť aj divergujúce interpretácie rovnakej evidencie. Ako príklad zvážme novú informáciu D: “Pán N vyhlásil v televízii, že jeden bežne užívaný liek je nebezpečný.” Traja pozorovatelia pán A, B a C sa o tom dozvedia. Ich apriori presvedčenie o nezávadnosti lieku je P(S|I)=(0.9, 0.1, 0.9) respetívne (I označuje množinu apriórnych informácii). A a C veria v nezávadnosť lieku a B v liek neverí. Otázne je nakoľko veria dotyční pánovi N. Všetci traja sa zhodnú v tom, že ak by bol liek nebezpečný tak by to N ohlásil, teda P(D| not S,I)=(1,1,1), ich názor sa však rozchádza v prípade ak je liek bezpečný P(D| S)=(0.01,0.3,0.99). Aposteriórnu pravdepodobnosť získame pomocou bayesovej vety P(S| D,I) =  P(D| S,I) P(S|I) /P(D|I) = (0.083, 0.32, 0.89). Pozorovatelia A a C teda hodnotia rovnakú evidenciu inak a to aj napriek tomu, že ich apriori presvedčenie je rovnaké. A si totiž povedal: N je dôveryhodná a znalá osoba a jeho názor treba brať vážne. Preto na základe jeho stanoviska liek, nepokladám za bezpečný. C si naopak povedal: N je magor, ktorí len túži na seba prilákať pozornosť planým poplachom. Jeho názor je v prípade že liek je bezpečný irelevantný a na mojom vnímaní jeho bezpečnosti nová informácia nič nezmení.

Situácie v ktorých ľudia v kontexte rovnakých informácii dospejú k rozličným záverom sú typické. Jaynes tvrdí, že tieto situácie nesmieme interpretovať ako ľudskú iracionalitu (Kahneman & Tversky), ale naopak je možné ich vysvetliť pomocou bayesiánskej štatistiky:

Jaynes rozvíja svoj nápad modelovania ľudskej psychológie pomocou bayesiánskej štatistiky v niekoľkých odstavcoch. Tento náčrt vyznieva z hľadiska súčasnej psychológie určite amatérsky ale na svoju dobu bol zaujímavý a nie je ťažké si predstaviť, že Tenenbaum a ostatní zástancovia bayesiánskej mysle sa značne inšpirovali práve u Jaynesa (Tenenbaum a co. na Jaynesovu knihu vo svojich publikáciach opakovane odkazujú).

Ani v tejto kapitole nie sú filozofi ušetrení obligátnej nakladačky. Ak nemodelujeme sprostredkovanosť informácii explicitne môžeme dojsť k nesprávnym záverom, na základe ktorých niektorí filozofi dospeli k mylnému zovšeobenenie, že nie model je chybný ale samotný inventár teórie pravdepodobnosti je na vine.

Princetonský filozof Richard C. Jeffreys odmieta modelovať P(A| B,I) pomocou Bayesovej vety: P(A| B,I) =  P(B| A,I) P(A|I) /P(B|I). Bayesova veta totiž nezohľadňuje neistotu zdroja tvrdení o B. Namiesto toho RCJ navrhuje vážený priemer P(A)=q P(A| B,I) + (1-q) P(A| not B,I). Takéto riešenie je presne to proti čomu Jaynes brojil v uvodných kapitolách knihy. Riešenie je ad-hoc. Nevychádza z axiómov teórie pravdepodobnosti. Ako také je nekonzistentné a vedie k paradoxom.

Správne riešenie spočíva v modelovaní neistoty zdroja. Ako v prípade spoľahlivosti lieku, musíme rozlíšiť informáciu C a samotnú skutočnosť B, ktorú C sprostredkuje. Následne môžeme odvodiť pomocou pravidla sumy a bayesovej vety P(A|CI)= P(AB|CI)+P(A notB|CI) = P(A|BCI) P(B|CI)+P(A| notBCI) P(notB|CI). Táto formulka sa trochu podobá na RCJ-ov návrh. Mohli by sme  zameniť P(B|CI) za q a P(notB|CI) za (1-q). RCJ však ignoruje priamy vplyv samotnej (hoc aj nesprávnej) správy C na A a namiesto P(A| C,B,I) zvažuje P(A| B,I), čo je chyba.

Kapitolu uzatvára diskusia Hempelovho paradoxu. Hempel vychádzal z tvrdenia “všetky vrany sú čierne”. Tento výrok je ekvivalentný ku “všetky ne-čierne objekty sú ne-vrany”, čo je podporené pozorovaním bielej topánky. Tým pádom je pozorovanie bielej topánky evidenciou, že všetky vrany sú čierne, čo odporuje intuícii, že všeobecné tvrdenie je podporované jednotlivými konkrétnymi pozorovaniami. Jaynes prezentuje riešenie Irvinga Gooda. Hempel vychádza zo striktne vzaté nesprávnej intuície, že pozorovanie jednej čiernej vrany podporuje tvrdenie že všetky vrany sú čierne. Či však jedno konzistenté pozorovanie potvrdí všeobecné tvrdenie závisí ako sme videli na prípade parapsychológie a spoľahlivosti lieku od alternatívnych hypotéz.Good ilustroval túto možnosť na nasledujúcom príklade. H1 z milióna vtákov je 100 čiernych vrán (žiadne biele vrany). H2 z dvoch miliónov vtákov tvoria 1.8 milióna biele vrany a 0.2 milióna čierne vrany. Pri takomto scenári pozorovanie čiernej vrany hovorí v neprospech H1 a teda v neprospech hypotézy, že všetky vrany sú čierne.

Jaynes uzatvára diskusiu povzdychom:

In the literature there are perhaps a hundred paradoxes” and controversies which are like this, in that they arise from faulty intuition rather than faulty mathematics. Someone asserts a general principle that seems to him intuitively right. Then when probability analysis reveals the error, instead of taking this opportunity to educate his intuition, he reacts by rejecting the probability analysis. […] As a colleague of the writer once remarked, “Philosophers are free to do whatever they please, because they don’t have to do anything right”. But a responsible scientist does not have that freedom; he will not assert the truth of a general principle, and urge others to adopt it, merely on the strength of his own intuition.

Pridaj komentár

Zadajte svoje údaje, alebo kliknite na ikonu pre prihlásenie:

WordPress.com Logo

Na komentovanie používate váš WordPress.com účet. Log Out / Zmeniť )

Twitter picture

Na komentovanie používate váš Twitter účet. Log Out / Zmeniť )

Facebook photo

Na komentovanie používate váš Facebook účet. Log Out / Zmeniť )

Google+ photo

Na komentovanie používate váš Google+ účet. Log Out / Zmeniť )

Connecting to %s