Graphical Models

Grafické modely (a.k.a. Bayesiánske siete) sú formou reprezentácie probabilistických a bayesiánskych modelov. Tento formalizmus sa etabloval koncom 90. rokov a umožňuje jednoducho a priehľadne zhrnúť komplexné probabilistické modely.

Základným prvkom týchto modelov sú množiny premenných a im zodpovedajúce rozdelenia pravdepodobnosti. Premennými môžu byť napríklad udalosti “tráva je mokrá” (m), “pršalo” (p) a “chodec nesie dáždnik” (d). Pravdepodobnosti reprezentujú očakávanú početnosť týchto udalostí napr. p(m)=.25 (v 25 % prípadoch je tráva mokrá), p(p)=.2 a p(d)=.3. Pravdepodobnosť, že pršalo a tráva je mokrá vyjadríme ako p(m,p)=.15. Podmienená pravdepodobnosť vyjadruje pravdepodobnosť jednej udalosti ak nastala udalosť iná. Napr. p(m|p) vyjadruje pravdepodobnosť, že tráva je mokrá ak pršalo. Túto pravdepodobnosť môžeme zistiť na základe početnosti alebo priamo vyrátať pomocou definície p(A|B)=p(A,B)/p(B). Teda p(m|p)=p(m,p)/p(p)=.75. V 75% prípadoch, keď pršalo je tráva mokrá.

Pomocou pravdepodobností môžeme popísať správanie systému. Stačí nám definovať pravdepodobnosti pre všetky možné kombinácie udalostí. Kombináciou môže byť napríklad “pršalo”, “tráva nie je mokrá” a “chodec nenesie dáždnik” (p,!m,!d). Dokopy máme tak 2^3 elementárnych situácii. Takáto forma definície je nepraktická pretože musíme určiť s počtom premenných exponenciálne rastúci počet parametrov. Mnoho týchto pravdepodobností rovných nule. Napríklad ak p(!m|p)=0, tak p(!m,p,d),p(!m,p,!d) a všetky ďalšie kombinácie s (!m,p) budú nulové. Grafické modely reprezentujú len relevantné nenulové pravdepodobnosti.

V našom prípade dážď podmieňuje mokrý trávnik. Dážď takisto podmieňuje výskyt dáždnikov. Aby bol náš príklad zaujímavejší priberme aj možnosť, že mokrý trávnik spôsobí, nezávisle od dažďa, že si chodec vezme dáždnik. Ak poznáme tieto podmienené pravdepodobnosti + pravdepodobnosť dažďu vieme odvodiť všetky ostatné pravdepodobnosti. Grafický model tejto situácie vyzerá nasledovne:

Uzly reprezentujú udalosti a šípky znázorňujú podmienenosť. Z grafu je možné vyčítať podmienenosť a nezávislosť udalostí. Z grafu je takisto možné vyčítať pravdepodobnosť elementárnych situácii. Každý uzol prispeje jedným členom v multiplikácii p(M,P,D)=p(P)p(M|P)p(D|M,P). Z tejto pravdepodobnosti môžeme získať pomocou p(A)=\sum_Bp(A|B)p(B) a definície podmienenej pravdepodobnosti všetky ostatné pravdepodobnosti. Takéto zjednodušenie je obzvlášť vítané ak máme udalosti s viac než dvoma stavmi alebo so stavom reprezentovaným kontinuálnou hodnotou (napr. teplota). Pravdepodobnosti vyjadrené pomocou čísiel v tabuľkách vystriedajú parametrické rozdelenia pravdepodobnosti, avšak grafické modely možno aplikovať stále rovnako.

Pomocou grafických modelov môžeme reprezentovať problémy, ktoré robia tradične vedcom problémy. Tu ponúkam na ilustráciu jeden z nich.

Definícia kauzality

Jednoduchá podmienená pravdepodobnosť p(A|B) nestačí na definovanie kauzality. Na jednej strane je p(A|B) silnejšia ako jednoduchá asociácia p(A,B), musíme však pribrať našu intuíciu, že A podmieňuje B a to nezávisle od všetkých ostatných udalostí (C).

V našom prípade napríklad prisúdime mokrej tráve slabý kauzálny vplyv na výskyt dáždnikov, keďže len sprostredkováva vplyv dažďa na výskyt dáždnikov. Ďalší príklad z Wiki: Hodnota CO2 v atmosfére a výskyt obezity prudko stúpli za posledných 50 rokov. Tvrdíme že obezita je spôsobená C02. Pravdepodobnejšie je však, že nárast užívania automobilov spôsobil oboje aj nárast obezity (ľudia menej chodia a bicyklujú) aj nárast CO2 v atmosfére.

Ak chceme získať informácie o kauzálnom vplyve musíme mať teda aj informácie o treťom potenciálnom faktore resp. všetkých ostatných faktoroch, ktoré ovplyvňujú A aj B. Vo vedeckej praxi k týmto všetkých udalostiam nemáme prístup, resp. je ich potenciálne nekonečne veľa. Namiesto toho sa snažíme prerušiť šípku od C ku A. Kedže C nepoznáme, manipulujeme A náhodne (a dúfame, že náš náhodný vzor nekoreluje s C).

Samozrejme vedci sú si intuitívne týchto súvislosti vedomí a preto je ich hlavným nástrojom experiment, kde nezávislé premenné A sú manipulované, B je meraná závislá premenná a C je náhodný faktor. Experimenty sú preferované voči jednoduchým pozorovaniam kde A nie je nezávislé od C a teda nie je možné z výsledkov vyvodiť kauzálne závery.

Pridaj komentár

Zadajte svoje údaje, alebo kliknite na ikonu pre prihlásenie:

WordPress.com Logo

Na komentovanie používate váš WordPress.com účet. Log Out / Zmeniť )

Twitter picture

Na komentovanie používate váš Twitter účet. Log Out / Zmeniť )

Facebook photo

Na komentovanie používate váš Facebook účet. Log Out / Zmeniť )

Google+ photo

Na komentovanie používate váš Google+ účet. Log Out / Zmeniť )

Connecting to %s