E.T. Jaynes: Probability Theory, Kapitola 1 a 2

Práve som začal lúskať knihu Probability Theory: The Logic of Science od Edwina Jaynesa. Na Mozgostrojoch prejdem knihu v sérii článkov, ktoré tvoria moje poznámky k jednotlivým kapitolám.

Edwin Jaynes bol fyzikom, ktorý sa zaoberal teóriou pravdepodobnosti a bayesiánskou štatistikou. Jeho hlavným dielom je kniha Probability Theory: The Logic of Science. Táto je založená na sérii prednášok a kurzov zo 60. a 70. rokov. Jaynes rozpracoval svoje poznámky do knižného formátu v 90. rokoch. Knihu však kvôli úmrtiu v 1998 nestihol dokončiť. Kniha vyšla v roku 2003, pričom niektoré plánované kapitoly chýbajú a ďalšie tvoria len hrubé náčrty a nie sú až tak upratané a uhladené ako by mohli byť. Okrem toho, že Jaynes zastáva bayesiánsky pohľad na štatistiku, vníma teóriu pravdepodobnosti ako rozšírenie logiky. Prvé dve kapitoly sa zaoberajú práve tým ako odvodiť teóriu pravdepodobnosti z logiky.

Myslím, že každá ambiciózna vedecká kniha musí skôr či neskôr konfrontovať dve veci. A to, že deduktívna, logická inferencia je na nič. A takisto sa musí dištancovať od pseudoproblémov, ktoré riešia a šíria filozofi. Ohľadom filozofie píše Jaynes:

Finally, some readers should be warned not to look for hidden subtleties of meaning which are not present. We shall, of course, explain and use all the standard technical jargon of probability and statistics, because that is our topic. But although our concern with the nature of logical inference leads us to discuss many of the same issues, our language diff ers greatly from the stilted jargon of logicians and philosophers. There are no linguistic tricks and there is no  meta-language gobbledygook; only plain English. We think that this will convey our message clearly enough to anyone who seriously wants to understand it. In any event, we feel sure that no further clarity would be achieved by taking the 1st few steps down that in finite regress that starts with: What do you mean by ‘exists’?

Prvá kapitola začína kritikou deduktívnej logiky. Jaynes poukazuje na to, že deduktívna logika hrá pri výskume bezvýznamnú rolu. Ešte aj “čistá” matematika používa pri svojich objavoch probabilistickú inferenciu aj keď v publikáciach ju nahradzujú logickými dôkazmi. Jaynesovým cieľom je rozšíriť výrokovú logiku. Namiesto dichotomických hodnôt pravda, nepravda Jaynes uvažuje o plauzibilite výrokov vyjadrenými kontinuálnymi hodnotami. Jaynes formuluje svoj cieľ aj nasledovne: “How could we build a machine which would carry out useful plausible reasoning, following clearly de fined principles expressing an idealized common sense?” (s. 105). Idealizovaný zdravý rozum, znamená, že robot implementuje základné pravidlá ľudského rozumovania bez kognitívnych obmedzení ako obmedzená selektívna pamäť alebo rôzne biasy. Jaynes formuluje nasledujúce axiómy:

  1. Hodnovernosť výrokov je vyjadrená číselne.
  2. Rozšírená logika musí kvalitatívne zohľadniť pravidlá zdravého rozumu.
  3. Konzistencia. Ak odvodíme určitú hodnovernosť výroku jedným validným spôsobom, musíme sa k rovnakej hodnote dopracovať aj všetkými ostatnými validnými spôsobmi.
  4. Všetká dostupná evidencia musí byť zohľadnená pri odvádzaní hodnovernosti výrokov.
  5. Pri rovnakom stave evidencie, musíme dospieť k rovnakým záverom – k rovnakej hodnovernosti výrokov.

Axióm 2 je formulovaný dosť abstraktne ale vyjadruje nasledujúce pozorovanie. Vo výrokovej logike platí sylogizmus “ak A implikuje B a A je pravda tak aj B je pravda”. Opačne však už neplatí “ak A implikuje B a B je pravda tak A je pravda” Pointa je v tom, že aj keď druhý sylogizmus neplatí nevyhnutne, mnohokrát naozaj platí a môže byť užitočný. Jaynes tento sylogizmus preformuluje nasledovne: “ak A implikuje B a B je pravda tak A je hodnoverné”.

Z vyššie uvedených axiómov Je možné odvodiť základnú definíciu hodnovernosti. Hodnovernosť je monotónna funkcia. Či stúpa alebo klesá táto funkcia a na akom intervale toto axiómy neurčujú. Arbitrárne sa rozhodneme pre stúpajúcu funkciu v intervale 0 až 1. Mohli by sme definovať iné intervaly (napr. klesajúcu funkciu na intervale nekonečno až 1), v zásade by sme sa dopracovali k rovnakej teórii vierohodnosti akurát by odvodené pravidlá vyzerali trochu krkolomnejšie. Dve základné pravidlá sú

  • Pravidlo násobenia: p(AB|C)=p(A|BC)p(B|C)=p(B|AC)p(A|C)
  • Pravidlo sumy: p(A|B)+p(\bar{A}|B)=1

Tieto pravidlá sú koncipované analogicky k pravidlám výrokovej logiky. Pravidlo sumy je odvodené z negácie. Ak A je pravda, tak \bar{A} je nepravda. Ak A je nepravda, tak \bar{A} je pravda. Ak pravdu reprezentujeme ako 1 a nepravdu ako 0, v oboch prípadoch získame ako sumu výroku a jeho negácie 1. Následne nám už stačí “zabaliť” výroky do pravdepodobností pomocou funkcie p(.) a získame pravidlo sumy. A|B je podmienkou – A je pravda ak B platí. Jaynes explicitne podmieňuje výrok A a jeho negáciu premennou B čo je množina všetkých ostatných hypotéz, ktorých vplyv na  pravdepodobnosti tiež treba zohľadniť. (Písal som, že cieľom filozofickej logickej argumentácie je ukryť kontroverzné premisy v argumentácii tak aby ich oponent nezbadal. Tieto sú ukryté práve v množine B.) Ak je B na pravej a ľavej strane iné, naše závery nemusia nevyhnutne platiť. To zodpovedá snahe experimentátorov pri manipulácii izolovať a vylúčiť faktory, ktoré by mohli ovplyvniť priebeh experimentu. V argumentácii to zodpovedá formulácii ceteris paribus.

Pravidlo násobenia je odvodené z konjunkcie. Ak A aj B sú pravda tak aj ich konjunkcia AB je tiež pravda a nepravda v opačných prípadoch. Ak pravdu reprezentujeme ako 1 ako nepravdu ako 0, hodnoty výrokov A a B môžeme vynásobiť a získame AB. Problémy nastanú ak začneme posudzovať výroky predikátovej logiky. Napr. “Existuje človek, ktorý má ľavé oko zelené” je pravda a  “Existuje človek, ktorý má pravé oko modré” je tiež pravda. Výrok “Existuje človek, ktorý má ľavé oko zelené a pravé oko modré” však pravdou nie je, vyššie uvedené pravidlo multiplikácie ho však za pravdivý označí. Ak chceme použiť takýto typ konjunkcie, musíme multiplikovať pravdivosť výrokov A|B a B (alebo alternatívne B|A a A). A|B znamená, že “Existuje človek, ktorý má pravé oko modré” ak platí, že tento človek má druhé oko zelené.  Následne nám už stačí zabaliť výroky do pravdepodobností pomocou funkcie p(.) a získame pravidlo násobenia. Rovnako ako pri pravidle sumy aj pri pravidle násobenia je množina všetkých ostatných hypotéz C explicitne uvedená.

Pomocou dvoch vyššie uvedených pravidiel možno odvodiť iné pravidlá, napr. dizjunkciu:

p(A+B|C)=p(A|C)+p(B|C)-p(AB|C)

Pointa je v tom, že tak ako v logike je možné všetky zložené výroky a pravidlá vyjadriť pomocou konjunkcie a negácie, tak je možné aj v rozšírenej logike pomocou pravidla násobenia a pravidla sumy odvodiť pravdepodobnosť všetkých ostatných výrokov.

Myslím, že Jaynesov most medzi logikou a pravdepodobnosťami je veľmi zaujímavý a viacero logických problémov a paradoxov možno riešiť ak akceptujeme, že výroky nie sú len pravdivé a nepravdivé ale pravdepodobné. V komentároch a prílohe ku kapitole Jaynes okrem iného diskutuje Gödelovu vetu a Kolmogorove axiómy. Kolmogorove axiómy definujú pravdepodobnosti pomocou množín. Jaynes argumentuje, že formulácia základných pravidiel je všeobecnejšia a na rozdiel od Kolmogorova ich odvádza z axiómov, ktoré by nemali byť kontroverzné.

Jaynes, E.T. (2003). Probability Theory: The Logic of Science. Cambridge University Press.

Pridaj komentár

Zadajte svoje údaje, alebo kliknite na ikonu pre prihlásenie:

WordPress.com Logo

Na komentovanie používate váš WordPress.com účet. Log Out / Zmeniť )

Twitter picture

Na komentovanie používate váš Twitter účet. Log Out / Zmeniť )

Facebook photo

Na komentovanie používate váš Facebook účet. Log Out / Zmeniť )

Google+ photo

Na komentovanie používate váš Google+ účet. Log Out / Zmeniť )

Connecting to %s