Jaynes: Probability Theory, Kapitola 8

8. kapitola ponúka diskusiu zopár vybraných štatistických konceptov (hlavne z frekventistickej literatúry). Pre bayesiánsku štatistiku sú tieto koncepty nepotrebné resp. vyplývajú automaticky v dôsledku definície pravdepodobnosti. Jaynes kontrastuje ad-hoc postulovanie týchto konceptov s princípmi teórie pravdepodobnosti ako rozšírenej logiky, ktorá je pevne vystavaná na axiómoch.

Postačujúca štatistika vyjadruje súhrn informácie z dát potrebný pre odhad. Napríklad aritmetický priemer tvorí postačujúcu štatistiku pre ML odhad strednej hodnoty gausovho rozdelenie. Aritmetický priemer tvorí redukovanú informáciu. Napr. trojice (3,3,3), (3,0,6) a (1,2,6) tvoria rozličné pozorovania, avšak ich aritmetický priemer je rovnaký a tým pádom aj ML odhad parametra je rovnaký. Keďže postačujúca štatistika nepoužíva celkovú informáciu v dátach, frekventisti musia odôvodniť prečo je takýto spôsob výpočtu, ktorý zanedbáva informácie valídny. V bayesiánskej analýze sa objavuje postačujúca štatistika automaticky. Bayesiánska analýza však na nej nie je závislá. Napríklad Cauchyho rozdelenie nemá postačujúcu štatistiku, čo nebráni jeho využitiu v bayesiánskej analýze. Zaujímavé je, že v bayesiánskej analýze závisí voľba postačujúcej štatistiky od voľby apriori rozdelenia. Ak totiž dáta poskytujú informáciu, ktorú už prior zahŕňa, táto informácia môže byť zanedbaná a postačujúca štatistika ju nezohľadní. Ako u postačujúcej štatistiky tak aj v prípade anticilárnej štatistiky a likelihood princípu, Jaynes konštatuje, že tieto koncepty sú z pohľadu štatistiky ako rozšírenej logiky zbytočné.

Jaynes diskutuje ako kombinovať evidenciu z viacerých experimentov. Typickým spôsobom sú metaanalýzy. V bayesiánskej analýze je kombinovanie dát z viacerých experimentov jednoduché. Výsledné aposteriórne pravdepodobnosti slúžia ako prior pre následné analýzy. Jaynes však varuje, že určité podmienky musia byť splnené a bayesiánska analýza (na rozdiel napr. od frekventistických meta-analýz) tieto podmienky explikuje.  Napríklad základný prior (predtým než sme videli akékoľvek dáta) musí byť spoločný pre všetky dáta. Takisto dáta musia byť kondicionované všetkými predchádzajúcimi dátami. Často predpokladáme, že dáta sú navzájom nezávisle, avšak tento predpoklad nie je samozrejmosťou. Jaynes ilustruje pomocou následného príkladu. Podľa istej čínskej bájky sa pokúsime odhadnúť výšku cisára na základe názoru jeho poddaných. Ak spriemerujeme názor milióna opýtaných obyvateľov dostaneme odhad výšky cisára s milimetrovou presnosťou. Problém je v tom, že názory obyvateľov nie sú navzájom nezávislé. Väčšina obyvateľov panovníka nikdy nevideli a svoj názor si nevytvorila nezávisle od ostatných ale na základe šíriacich sa klebiet.

Jaynes diskutuje nasledujúcu námietku voči teórii pravdepodobnosti ako rozšírenej logiky. Problém sa týka voľby množiny hypotéz a tvrdení, ktorých pravdepodobnosť chceme zistiť. Napríklad môžeme zvoliť výrok “pes beží”. Tento môžeme rozsekať na elementárne výroky “pes sa odrazil prednou pravou nohou od zeme”,”dopadol na ľavú zadnú nohu”… Akú mieru detailu zvoliť? Jaynes ukazuje, že v hraničných prípadoch detailná voľba precíznosti výsledok výpočtu neovplyvní a delenie hypotéz si môžeme odpustiť. Napr. ak nás zaujíma pravdepodobnosť či pes nebeží tak informáciu, ktorá konkrétna laba sa odrazila od zeme si môžeme odpustiť. Úplne stačí, že vieme že sa pes odrazil od zeme.

Jaynes diskutuje ešte zopár ďalších ad-hoc trikov a problémov. Zároveň konštatuje:

Since there is no end to the conceivable arbitrary devices that might be invented, we see no way to prove once and for all that no such attempt will succeed, other than pointing to Cox’s theorems. But for any particular device we can always find a direct proof that it will not work; that is, the device cannot change our conclusions unless it also violates one of our Chapter 2 desiderata. (s. 264-265)

Podľa Jaynesa ad-hoc pravidlá sú populárne vďaka ich intuitívnosti, avšak rigorózne odvodenie z axiómov nemôžu nahradiť:

Clever tricks are always pleasant diversions, and useful in a temporary way, when we want only to convince someone as quickly as possible. Also, they can be valuable in understanding a result; having found a solution by tedious calculation, if we can then see a simple way of looking at it that would have led to the same result in a few lines, this is almost sure to give us a greater con dence in the correctness of the result, and an intuitive understanding of how to generalize it. […] But the road to success in probability theory is through mastery of the general, systematic methods of permanent value. (s. 269)

Pridaj komentár

Zadajte svoje údaje, alebo kliknite na ikonu pre prihlásenie:

WordPress.com Logo

Na komentovanie používate váš WordPress.com účet. Log Out / Zmeniť )

Twitter picture

Na komentovanie používate váš Twitter účet. Log Out / Zmeniť )

Facebook photo

Na komentovanie používate váš Facebook účet. Log Out / Zmeniť )

Google+ photo

Na komentovanie používate váš Google+ účet. Log Out / Zmeniť )

Connecting to %s