Judea Pearl: Causality (Časť 2)

Druhá kapitola sa zaoberala najťažším prípadom inferencie, keď máme dané len rozdelenie pravdepodobnosti. V tretej kapitole poznáme okrem pravdepodobností aj graf, teda kauzálnu štruktúru problému. Vďaka tejto znalosti môžeme posúdiť vplyv manipulácii na pozorované pravdepodobnosti. V tretej kapitole sa Pearl zaoberá elementárnymi manipuláciami, ktoré zvonku určia hodnotu určitej premennej a snažia sa zistiť následky. Vo štvrtej kapitole potom Pearl rozoborá komplikovanejšie reťaze manipulácii a reaktívnych stratégii, kde manipulácia závisí pozorovaných hodnôt iných premenných.

Formálne predstavuje manipulácia premennej A dosadenie určitej hodnoty nezávisle od rodičov A v grafe. V grafe vyššie, ak chceme pozorovať kauzálny efekt manipulácie A=a na premennú B musíme zmeniť A na pozorovanú premennú s hodnotou a. To znamená, že musíme odstrániť všetky šípky smerujúce do A. A je externe manipulované a tým pádom nezávislé od svojich rodičov v grafe. Výsledný graf je znázornený vpravo. Pre oba grafy môžeme vypočítať P(A,B,C,D1,D2,D3) a porovnaním pravdepodobností zistiť efekt manipulácie na na P(B). Pearl označuje toto rozdelenie ako P(B| do(A=a)) , kde do(A=a) vyjadruje úpravu grafu. Konkrétne platí

P(b|do(A=a)) = \sum_{pa} P(b|a,pa) P(pa)

, kde pa je množina rodičov. Intuitívne, ak máme pozorovania fungovania v grafe vľavo a chceme zistiť ako by ovplyvnilo A=a premennú B, tak sa pozrieme na prípady, keď A (zhodou okolností) nadobudlo túto hodnotu a a pýtame sa, čo sa vtedy stalo s B. Problémom sú tretie premenné, ktoré vplývajú na A a aj na B. Vplyv týchto premenných anulujeme tým, že P(b|a) vážime v závislosti od rodičov A. Rovnicu vyššie možno interpretovať ako vážený priemer.

Samozrejme podmienkou vyššie uvedeného výpočtu je, že vplyv rodičov poznáme. Pripomínam, že je daný graf a pozorovania. Pozorovania však nemusia zahŕňať všetky premenné definované v grafe. Musíme sa preto pýtať ktoré premenné musíme pozorovať, aby sme vedeli určiť kauzálny súvis. Pearl ponúka viacero grafických kritérii, ktoré poslúžia ako rýchle heuristiky. Podľa kritéria únikových dverí musia byť všetky únikové cesty (teda šípky smerujúce do A) z A do B blokované množinou pozorovaných premenných D.

Možno trochu prekvapivo bezhlavé pridávanie kontrolných D nemusí byť prospešné pre analýzu. Pridanie premenných,ktoré sú potomkami A totiž môže odblokovať únikové cesty. V grafe nižšie chcem určiť vplyv liečby (L) na chorobu (Ch). Ak zahrniem bolesť hlavy (H), ktorú liečba spôsobuje ako kontrolnú premennú do analýzy tak si spôsobím problém. Keďže gény (G) okrem choroby ovplyvňujú aj bolesť hlavy vznikne medzi chorobou a liečbou nepravý súvis, sprostredkovaný novou vedľajšou cestou v grafe cez bolesť hlavy a gény. Keďže H tvorí strediska, táto cesta je odblokovaná práve v prípade keď je H pozorované.

Okrem kritéria únikových ciest ponúka Pearl ďalšie. Všeobecne možno určiť P(b|do(A=a)) a vskutku P(b|do(A_1=a_1), \dots , do(A_n=a_n)) pre ľubovôlnú množinu manipulácii premenných A_1, \dots, A_n pomocou takzvaného intervenčného kalkulusu. Tento poskytuje pravidlá ako na základe grafu a pozorovaných nezávislostí pretaviť výrazy s vokáňom do výrazov bez neho. Jeho aplikácia je komplikovanejšia. Grafické kritéria (napr. kritérium únikových ciest) sú na druhej strane jednoduchšie ako keby sme sa mali prebíjať aritmetikou. Kalkulus garantuje nájdenie riešenia ak takéto existuje a zároveň ak riešenie neexistuje (kvôli prítomnosti konfundujúcich premenných) zistíme, že tomu tak je. V druhom vydaní Pearlovej knihy pribudlo aj všeobecné grafické kritérium, ako zistiť či efekt manipulácie možno vypočítať. Toto hovorí, že neexistuje žiadna latentná premenná spájajúca uzol A s jeho deťmi. V tomto prípade možno P(b|do(A=a)) určiť.

Asi najväčším prekvapením tejto kapitoly pre mňa bolo, že pridávanie kontrolných premenných môže byť kontraproduktívne pre zistenie kauzálnych príčin. V psychológii mnohokrát kontrolujeme a balancujeme, čo sa dá. V psychológii zároveň kauzálny graf prakticky nikdy nepoznáme. Akurát vieme, že všetko súvisí so všetkým a za každým rohom sa skrýva latentná príčina. V tomto prípade asi najlepšou taktikou je naozaj kontrolovať a balancovať experiment. Zároveň si ale musíme byť vedomí ťažkostí, ktoré toto môže privodiť. Pearlove formalizmy umožňujú spoľahlivo identifikovať premenné vhodné pre kontrolu a manipuláciu.