Judea Pearl: Causality (Časť 4)

V tomto článku rozoberiem posledné 4 kapitoly (7.-10.) Pearlovej knihy. Siedma kapitola, tak ako 2., 3. a 5. kapitola je nabitá obsahom zatiaľčo kapitoly 8., 9. a 10. sú venované diskusiám a rôznym lemám a zovšeobecneniam. V 2. a 3. kapitole sme sa zaoberali kauzálnymi grafmi. Tieto vyjadrujú všeobecnú kauzálnu štruktúru napríklad, že chodec ktorého zrazí auto zomrie. Kauzálna štruktúra platí pre všetky možné modely,kde príčina x ovplyvňuje výsledok y y = f_y(x,u_y) (kde u_y vyjadruje vplyv latentných faktorov). Štrukturálne rovnice (kapitola 5.) špecifikujú f(\dot) a sú tým pádom konkrétnejšie. V prípade auta ktoré zrazilo chodca môže napríklad štrukturálna rovnica vyjadrovať pravdepodobnosť úmrtia v závislosti od rýchlosti auta y = \sigma(x-20 + u_y), kde x je rýchlosť v km/h, \sigma je sigmoidálna funkcia a u_y \sim \mathcal{N}(\mu = 0, \sigma = 5) vyjadruje neistotu prameniace z neznalosti ostatných faktorov ako je zdravotná kondícia obete, v akej pozícii do človeka auto narazilo a.t.ď.

Kapitola 7. sa zaoberá ešte detailnejšou znalosťou, znalosťou hodnoty, ktorú u_y nadobudlo v konkrétnej situácii. Štrukturálna rovnica platí pre všetky situácie. Znalosť u_y vyjadruje konkrétnu situáciu napríklad, že Fera včera zrazilo auto na prechode pri rýchlosti 70 km/h, konkrétnej konfigurácii okolností zhrnutej do hodnoty u_y=30. Aj v tomto prípade môžeme vykonať zaujímavé analýzy, konkrétne môžeme sa zaoberať hypotetickými úvahami. (Tzv. counterfactuals u Pearla aj keď Pearl považuje tento názov za nevhodný, keďže vyjadruje protichodnosť). Môžeme sa spýtať či by chodec zomrel ak by auto išlo pomalšie a teda napríklad či je auto dostatočnou, nevyhnutnou príčinou úmrtia. Takéto otázky sú vysoko relevantné pri testovaní medikamentov a v právnych sporoch. Žiaľ tradičná štatistika má s nimi problémy. A to napriek tomu, že ľudia takéto hypotetické otázky rutinne hodnotia. V našom príklade je hodnota u_y=30 natoľko vysoká že aj keby auto stálo na mieste x=0 chodec by na zrážku zomrel. Toto zodpovedá vysoko nepravdepodobnej situácii (vskutku p(u_y \ge 30) < 0.001), že chodec idúc cez cestu sa šmykol, pri páde narazil do zaparkovaného auta a na následky zranení po náraze zomrel. V tomto prípade je nepravdepodobné, že auto spôsobilo smrť.

Formálne môžeme vyhodnotiť takéto situácie nasledovne. Potrebná je znalosť grafu a štrukturálnych rovníc. Konkrétna znalosť u nie je potrebná (a keďže ide o latentné faktory ich pozorovanie mnohokrát ani nie je možné). Tieto môžeme odhadnúť na základe pozorovaní ostatných faktorov. Napríklad v lineárnom modeli tvoria u rezídua, teda odchýlku pozorovaných hodnôt od predpovedí. Pri hypotetických výrokoch nás zaujíma pravdepodobnosť, že dôsledok Y nadobudne hodnotu y, ak X zmeníme na x pri latentných okolnostiach U=u,  p(Y=y| do(X=x),U=u). Pearl v tejto časti knihy používa zjednodušenú notáciu p(y_x(u)), ktorú preberiem aj v tomto článku. Inferencia p(y_x(u)) prebieha v troch krokoch.

1. Abdukcia. Na základe pozorovania Y=y’, X=x’ a všetkých ostatných meraných faktorov W=w’ odhadneme rozdelenie U=u.

2. Modifikácia. Prevedieme operáciu do(X=x). V 3. kapitole sme videlo, že to znamená modifikáciu grafu a štrukturálnych rovníc, tak že X nie je závislé na svojich rodičoch v grafe ale nadobúda pevne stanovenú hodnotu x.

3. Predpoveď. V modifikovanom grafe dosadíme U=u a vypočítame pravdepodobnosť p(Y=y).

Podobne ako v tretej kapitole ponúka Pearl kalkulus hypotetického myslenia, ktorý umožňuje systematicky zredukovať hypotetické výroky na formulu, ktorá pozostáva len z pozorovaných pravdepodobností (a túto pravdepodobnosť je možné určiť). Pravidlá sú nasledovné. Pre množiny premenných X, Y a W platí:

1. Kompozícia: W_x(u)=w \Rightarrow Y_{xw}(u)=Y_x(u). Ak W nadobúda hodnotu w za podmienok u tak môžeme manipuláciu w za rovnakých podmienok odstrániť z dolného indexu, keďže táto manipulácia hodnotu W nijak neovplyvní.

2. Efektívnosť: X_{xw}(u)=x pre všetky X a W. Manipulácia X zmení X nezávislé od hodnôt ostatných premenných W.

3. Obrátiteľnosť: (Y_{xw}(u)=y) \wedge (W_{xy}(u)=w) \Rightarrow Y_x(u)=y. Rovnosť vyjadruje predikát, že medzi premennými nie je možný feedback. V opačnom prípade vyhodnotenie hypotetických výrokov nie je možné.

Tieto tri pravidlá umožňujú určiť, či je vyhodnotenie hypotetického výroku možné a ak áno nájde formulu pre výpočet.

V podstate všetky aplikácie hypotetických úvah ktorými sa Pearl zaoberá v nasledujúcich kapitolách 8,9,10 vychádzajú z binárnych náhodných premenných. Toto dáva zmysel, keďže väčšina hypotetických úvah má takúto štruktúru, značne to zjednodušuje vysvetlenia a v zásade všetky kontinuálne premenné možno redukovať na binárne pomocou prahovej hodnoty. Napríklad kontinuálnu rýchlosť vozidla v príklade vyššie môžeme redukovať na binárnu premennú x>20.

V 8. kapitole Pearl rozoberá nedokonalé experimenty. Dobrým príkladom je napríklad farmakologická štúdia, v ktorej nie všetci probanti dodržali program dávkovania. Buď ho niektorí v experimentálnej skupine zanedbali alebo si zúfalí pacienti v kontrolnej skupine potajme medikament zadovážili. Ak máme informáciu o dávkovaní môžeme naše odhady kauzálneho vplyvu medikamentu na zdravie korigovať. Hypotetické úvahy hrajú dôležitú úlohu. Pri nedokonalých experimentoch totiž musíme vyhodnotiť hypotetický scenár, ak by probant ktorý liek nevzal, vykonal inak, aký dopad by to malo na jeho zdravie.

V deviatej kapitole sa Pearl zaoberá nevyhnutnou a postačujúcou príčinou. Napríklad prítomnosť kyslíka v miestnosti je nevyhnutná aby sme založili oheň. Kyslík je teda nevyhnutnou príčinou ohňa. Naopak ak sme odsúdili väzňa na odstrel, ktorý vykonajú traja paralelní strelci A, B, C tak výstrel strelca A nie je nevyhnutnou príčinou smrti väzňa, lebo väzeň by zomrel aj keby by A nevystrelili. Naopak výstrel každého zo strelcov je postačujúci na to aby väzeň umrel (vychádzajúc z toho, že strelci deterministicky splnia povel). Naopak kyslík nie je dostatočnou príčinou. Vo väčšine miestností s kyslíkom nehorí. Dodatočná udalosť je nutná (napr. škrtnutie zápalky), aby oheň vypukol.

Pravdepodobnosť, že X je nevyhnutnou príčinou Y je daná ako

p(y'_{x'}|x,y)=\frac{p(y)-p(y_{x'})}{p(x,y)}

Pravdepodobnosť, že X je postačujúcou príčinou Y je daná ako

p(y_x| y',x')= \frac{p(y_x)-p(y)}{p(x',y')}

Kde X, Y a U sú binárne premenné a y',x' a u' sú komplementárne hodnoty ku x,y,u.

Aby sme určili členy p(y_{x'}), p(y_x) v rovniciach vyššie sú potrebné experimentálne štúdie. Naopak aby sme určili p(y',x'), p(y,x) sú potrebné pozorovania. V experimentoch je totiž x manipulovaná, tým pádom nepoznáme prirodzené rozdelenie x. Pearl však ukazuje, že za zmysluplných predpokladov možno použiť jednoduchšie rovnice, ktoré vychádzajú len z experimentálnych dát alebo len z pozorovaní.

Nakoniec v desiatej kapitole sa Pearl zaoberá konkrétnymi a všeobecnými príčinami. Napríklad vo výroku “nadmerné pitie alkoholu môže viesť k úmrtiu” možno označiť alkohol ako všeobecnú príčinu úmrtia. Naopak v tvrdení “náš ruský kamarát Alexei zomrel po vypití litra vodky na otravu alkoholom” možno označiť alkohol ako konkrétnu príčinu. Formálne, v obidvoch situáciách je známa kauzálna štruktúra a takisto model daný štrukturálnymi rovnicami. Pri konkrétnych príčinách však dodatočne poznáme aj hodnoty niektorých latentných premenných. Tieto sú dané práve znalosťou konkrétnej situácie “Alexei, náš ruský kamarát …”. Táto znalosť môže zjednodušiť štrukturálne rovnice a viesť k redukovanému grafu. Napríklad y = ax + buz môžeme zredukovať na f_i = ax_1 ak vieme, že u=0. Redukovaný graf nazýva Pearl kauzálnym lúčom. V tomto grafe môžeme následne vyhodnotiť pravdepodobnosť, že x je príčinou y. Táto pravdepodobnosť vyjadruje pravdepodobnosť konkrétnej príčiny. Napríklad u=0 môže vyjadrovať fakt, že Alexei nepožil dodatočne žiadne drogy a teda že drogy z nemali vplyv na jeho úmrtie. V opačnom prípade by bola pravdepodobnosť, že alkohol bol konkrétnou príčinou jeho úmrtia nižšia.

Snáď nemusím dodať, že Pearlova kniha sa mi veľmi páčila. Kniha patrí do môjho obľúbeného štýlu tvrdohlavých monografii. Koncepty sprostredkované v knihe nie sú ťažké. Hlavnou ťažkosťou je vyvodiť z nich aplikácie a prevziať ich do praxe. Nemyslím, že hlavným problémom by pritom bola ich zriedkavá aplikovateľnosť. Práve naopak. Pearlova kauzalita poskytuje dôležité informácie pre psychologickú výskumnú prax a takisto ako ukázali Tenenbaum a ostatní môže byť inšpiráciou pre modeli kauzálneho myslenia u ľudí. Nepochybujem, že viaceré aplikácie Pearlovej kauzality v kognitívnych vedách uvidíme ešte ďalších článkoch na Mozgostrojoch.

Reklamy

Judea Pearl: Causality (Časť 3)

Zatiaľčo druhá a tretia kapitola tvoria teoretické mäso, štvrtá až šiesta kapitola tvoria aplikáciu a diskusiu. Štvrtá kapitola sa zaoberá zovšeobecneným Pearlovho do(X=x) formalizmu. Pearl ukazuje ako vyhodnotiť viaceré manipulácie P(Y|do(X_1=x_1),\dots, do(X_n=x_n)) . Takúto viacnásobnú manipuláciu môžeme nazvať intervenčný plánom. Moc nového sa však nedozvieme. Tieto plány možno vyhodnotiť pomocou intervenčného kalkulu z tretej kapitoly. Jedinou dodatočnou komplikáciou je že si musíme dať pozor v akom poradí transformujeme do(X_i=x_i) na X_i=x_i. Nie všetky sekvencie musia viesť k riešeniu. Aby sme zistili, či je efekt identifikovateľný musíme prešetriť všetky možné sekvencie. Pearl ukazuje ako toto šetrenie zjednodušiť a urýchliť.

Ďalšie zovšeobecnenie umožňuje rozšírenie manipulácie na ľubovoľné funkcie P(Y|do(X=g(z)), kde g(z) je funkciou ostatných premenných v grafe. Aj v tomto prípade výsledky z tretej kapitoly platia. Akurát si musíme dať pozor ktoré premenné zahrnemie do z, tak aby efekt intervencii zostal identifikovateľný.

Piata kapitola diskutuje modelovanie pomocou štrukturálny rovníc (SEM), ktoré je populárne hlavne v sociálny vedách. Predchádzajúce kapitoly vychádzali zo všeobecného prípadu a výsledky platia pre ľubovoľný model x_i = f_i(pa_i,\eta_i). T.j. každá premenná je funkciou hodnôt svojich rodičov pa_i a náhodného faktora \eta_i. Štrukturálne modely špecifikujú lineárny vzťah: x_i = \sum_{k \not = i} \alpha_{ik}x_k + \eta_i , kde \eta_i sú navzájom nezávislé náhodné premenné a \alpha_{ik} tvoria neznáme koeficienty.

V zásade všetky výsledky popísané v predchádzajúcich kapitolách platia aj pre SEM, poprípade sa dajú vďaka lineárnej formulácii zjednodušiť. Pearlova diskusia sa točí hlavne okolo interpretácie ktorej sa SEM historicky dostalo od štatistikov, epidemiológov a sociálnych vedcov. Pre Pearla sú štrukturálne rovnice ekvivalentnou reprezentáciou ako grafy. Vyjadrujú rovnakú t.j. kauzálnu informáciu. Konkrétne \alpha_{ik} vyjadrujú o koľko sa v priemere zmení x_i ak manipulatívne zmeníme x_k o jednu jednotku. Táto intepretácia uniká štatistikom, keďže nemajú jasnú definíciu kauzality. Štatistici tak interpretujú štrukturálne rovnice ako regresiu kde \alpha_{ik} tvoria regresné koeficienty a \eta_i je reziduálna odchýlka. V takto vnímaných rovniciach možno presúvať členy z ľavej na pravú stranu od rovnítka, čo vedie k problémom. Použitie rovnítkovej notácie tak trochu zavádza. Rovnítko vyjadruje jednosmerné kauzálne priradenie príčina k efektom a členy nemožno presúvať.

Zaujímavé je v kontexte SEM sa pozrieť na fyzikálne zákony, napr. Ohmov zákon: I=V/R, kde I je prúd, V napätie a R vyjadruje odpor vodiča. Tieto zákony možno interpretovať ako štrukturálne rovnice. Vidíme, že vo fyzikálnych zákonoch chýba stochastický člen \eta. Model je deterministický a nepredpokladá prítomnosť žiadnych ďalších faktorov. Ohmov zákon možno interpretovať kauzálne – pridaním napätia spôsobíme vyšší prietok elektrického prúdu vodičom. V tomto zmysle možno 1/R interpretovať ako koeficient \alpha. Z pohľadu fyziky nie je problém prehodiť členy z ľavej na pravú stranu a naopak. Napríklad môžeme získať R= V/I. Z pohľadu kauzálnej interpretácie je však takáto úprava neprípustná. Rovnica by vyjadrovala, že pridaním prúdu (pri konštantnom napätí) môžeme zmeniť odpor vodiča, čo je zjavne nezmysel. Čiže aj keď fyzici manipulujú rovnice, nie všetky výsledné formulácie sú si rovné. Nie všetky sú kauzálne interpretovateľné.

Kauzálna interpretácia fyzikálnych zákonov nás nevyhnutne vedie k otázke definície systému. Ak sa pozrieme na vesmír ako uzavretý celok, tento nepripúšťa žiadne alternatívne udalosti. Fyzikálny vesmír tvorí deterministický stroj, ktorého dianie je nevyhnutne dané jeho počiatočným stavom. Z tohoto pohľadu nedáva ani pojem kauzality zmysel. Žiadne manipulácie nie sú možné a žiadne alternatívy neexistujú. Kauzálne interpretácie začnú byť zmysluplné ak z vesmíru vystrihneme určitý výsek – ak definujeme systém, ktorý chceme skúmať. V tomto ohľade sa Pearlove predstavy veľmi podobajú na úvahy o kauzalite u Norberta Bischofa, ku ktorým sa snáď niekedy vrátim (niečo už bolo spomenuté tu).  Všeobecne, definícia systému znamená vymedzenie jeho hraníc. Tým má zmysel uvažovať o externej manipulácii. Zákony a štrukturálne rovnice nám umožňujú kompaktne popísať ako takéto manipulácie ovplyvnia fungovanie systému.

Ako som spomenul piata a šiesta kapitola sa zaoberajú z veľkej časti kontroverziami a paradoxami, ku ktorým dochádza ak výskumník nie je vyzbrojený formálnou definíciou kauzality. Neznalí môžu opomenúť tieto diskusie ako historické kontroverzie. Snáď ešte ako tak zaujímavé sú formálne definície niektorých konceptov, o ktorých experimentátori bežne hovoria a uvažujú. Pomocou Pearlových formalizmov, môžeme vyjadriť pravdepodobnosť priameho efektu, vedľajšieho efektu a celkového efektu. Priamy efekt tvorí v grafe šípka z X do Y. Celkový efekt tvoria všetky cesty z X do Y a vedľajší efekt tvorí celkový efekt mínus priamy efekt (teda všetky vedľajšie cesty). Prečo rozlišovanie týchto efektov dáva zmysel si môžeme spriehľadniť na nasledujúcom príklade. Ak chceme zistiť či sú ženy pri pohovoroch (napr. prijímačky na vysokú školu) diskriminované na základe pohlavia, nestačí nám zistiť či je úspešnosť žien na pohovoroch nižšia ako úspešnosť mužských uchádzačov. Je možné, že muži sú kompetentnejší a výberové konanie tieto kompetencie zohľadňuje. Kompetencie uchádzačov, ktoré korelujú s pohlavím a aj s úspešnosťou uchádzača tak môžu spôsobiť koreláciu medzi pohlavím a úspešnosťou. V tomto prípade hovoríme o vedľajšom efekte. Na výbere kompetentných uchádzačov nie je nič zlé, práve naopak. Ak sa pýtame na existenciu diskriminácie zaujíma nás priamy efekt pohlavia na úspešnosť a vedľajšie efekty chceme ignorovať. T.j. pýtame sa aký efekt by mala zmena pohlavia na úspešnosť ak by sme všetky ostatné premenné držali na konštantnej úrovni. Pearlov formalizmus umožňuje posúdiť silu týchto efektov na základe pozorovaní bez nutnosti manipulácie.

Že by vyššie uvedená úloha mohla byť riešiteľná len na základe pozorovaní, sa zdá uletené. Ako držať konštantné všetky faktory? Ktoré sú to faktory? A na akej úrovni ich chceme držať konštantné? Východiskom výpočtov je samozrejme naša znalosť kauzálnej štruktúry problému. Našťastie nemusíme poznať všetky faktory. Stačí nám poznať rodičov príčiny X, teda faktory ktoré majú priamy vplyv na pohlavie uchádzačov a kontrolovať tieto.

Otázka hodnôt kontrolovaných faktorov ostáva na výbere vedca. Pearl poznamenáva, že zaujímavou voľbou je zvoliť hodnoty, ktoré by nadobudli tieto faktory ak by sme zvolenú hodnotu príčiny pozorovali (a nie manipulovali). Pearl hovorí o prirodzenom priamom efekte, ktorý možno formálne vyjadriť ako

\sum_z ( E(Y| do(x',z))- E(Y|do(x,z)) )P(z|do(x))

kde E(Y) je očakávaná hodnota efektu, x je pozorovaná hodnota a x' je manipulovaná hodnota príčiny. Intuitívne, prirodzený priamy efekt vyjadruje výsledky experimentu, v ktorom by uchádzači zmenili pohlavie a všetky ostatné faktory – vek, kompetencie, CV, priebeh pohovoru etc. ostali rovnaké. Takýto experiment nie je možné vykonať. Že je možné inferovať výsledky tohoto experimentu na základe pozorovaní bežných pohovorov je podľa mňa absolútne úžasné!

Judea Pearl: Causality (Časť 2)

Druhá kapitola sa zaoberala najťažším prípadom inferencie, keď máme dané len rozdelenie pravdepodobnosti. V tretej kapitole poznáme okrem pravdepodobností aj graf, teda kauzálnu štruktúru problému. Vďaka tejto znalosti môžeme posúdiť vplyv manipulácii na pozorované pravdepodobnosti. V tretej kapitole sa Pearl zaoberá elementárnymi manipuláciami, ktoré zvonku určia hodnotu určitej premennej a snažia sa zistiť následky. Vo štvrtej kapitole potom Pearl rozoborá komplikovanejšie reťaze manipulácii a reaktívnych stratégii, kde manipulácia závisí pozorovaných hodnôt iných premenných.

Formálne predstavuje manipulácia premennej A dosadenie určitej hodnoty nezávisle od rodičov A v grafe. V grafe vyššie, ak chceme pozorovať kauzálny efekt manipulácie A=a na premennú B musíme zmeniť A na pozorovanú premennú s hodnotou a. To znamená, že musíme odstrániť všetky šípky smerujúce do A. A je externe manipulované a tým pádom nezávislé od svojich rodičov v grafe. Výsledný graf je znázornený vpravo. Pre oba grafy môžeme vypočítať P(A,B,C,D1,D2,D3) a porovnaním pravdepodobností zistiť efekt manipulácie na na P(B). Pearl označuje toto rozdelenie ako P(B| do(A=a)) , kde do(A=a) vyjadruje úpravu grafu. Konkrétne platí

P(b|do(A=a)) = \sum_{pa} P(b|a,pa) P(pa)

, kde pa je množina rodičov. Intuitívne, ak máme pozorovania fungovania v grafe vľavo a chceme zistiť ako by ovplyvnilo A=a premennú B, tak sa pozrieme na prípady, keď A (zhodou okolností) nadobudlo túto hodnotu a a pýtame sa, čo sa vtedy stalo s B. Problémom sú tretie premenné, ktoré vplývajú na A a aj na B. Vplyv týchto premenných anulujeme tým, že P(b|a) vážime v závislosti od rodičov A. Rovnicu vyššie možno interpretovať ako vážený priemer.

Samozrejme podmienkou vyššie uvedeného výpočtu je, že vplyv rodičov poznáme. Pripomínam, že je daný graf a pozorovania. Pozorovania však nemusia zahŕňať všetky premenné definované v grafe. Musíme sa preto pýtať ktoré premenné musíme pozorovať, aby sme vedeli určiť kauzálny súvis. Pearl ponúka viacero grafických kritérii, ktoré poslúžia ako rýchle heuristiky. Podľa kritéria únikových dverí musia byť všetky únikové cesty (teda šípky smerujúce do A) z A do B blokované množinou pozorovaných premenných D.

Možno trochu prekvapivo bezhlavé pridávanie kontrolných D nemusí byť prospešné pre analýzu. Pridanie premenných,ktoré sú potomkami A totiž môže odblokovať únikové cesty. V grafe nižšie chcem určiť vplyv liečby (L) na chorobu (Ch). Ak zahrniem bolesť hlavy (H), ktorú liečba spôsobuje ako kontrolnú premennú do analýzy tak si spôsobím problém. Keďže gény (G) okrem choroby ovplyvňujú aj bolesť hlavy vznikne medzi chorobou a liečbou nepravý súvis, sprostredkovaný novou vedľajšou cestou v grafe cez bolesť hlavy a gény. Keďže H tvorí strediska, táto cesta je odblokovaná práve v prípade keď je H pozorované.

Okrem kritéria únikových ciest ponúka Pearl ďalšie. Všeobecne možno určiť P(b|do(A=a)) a vskutku P(b|do(A_1=a_1), \dots , do(A_n=a_n)) pre ľubovôlnú množinu manipulácii premenných A_1, \dots, A_n pomocou takzvaného intervenčného kalkulusu. Tento poskytuje pravidlá ako na základe grafu a pozorovaných nezávislostí pretaviť výrazy s vokáňom do výrazov bez neho. Jeho aplikácia je komplikovanejšia. Grafické kritéria (napr. kritérium únikových ciest) sú na druhej strane jednoduchšie ako keby sme sa mali prebíjať aritmetikou. Kalkulus garantuje nájdenie riešenia ak takéto existuje a zároveň ak riešenie neexistuje (kvôli prítomnosti konfundujúcich premenných) zistíme, že tomu tak je. V druhom vydaní Pearlovej knihy pribudlo aj všeobecné grafické kritérium, ako zistiť či efekt manipulácie možno vypočítať. Toto hovorí, že neexistuje žiadna latentná premenná spájajúca uzol A s jeho deťmi. V tomto prípade možno P(b|do(A=a)) určiť.

Asi najväčším prekvapením tejto kapitoly pre mňa bolo, že pridávanie kontrolných premenných môže byť kontraproduktívne pre zistenie kauzálnych príčin. V psychológii mnohokrát kontrolujeme a balancujeme, čo sa dá. V psychológii zároveň kauzálny graf prakticky nikdy nepoznáme. Akurát vieme, že všetko súvisí so všetkým a za každým rohom sa skrýva latentná príčina. V tomto prípade asi najlepšou taktikou je naozaj kontrolovať a balancovať experiment. Zároveň si ale musíme byť vedomí ťažkostí, ktoré toto môže privodiť. Pearlove formalizmy umožňujú spoľahlivo identifikovať premenné vhodné pre kontrolu a manipuláciu.

Judea Pearl: Causality (Časť 1)

Jaynesovu knihu som úž dávnejšie dočítal. Súhrny pre Mozgostroje som zatiaľ vynechal. Chcem tieto kapitoly prečítať pozorne ešte druhý krát a poprípade konfrontovať ďalšie zdroje. Súhrny zvyšných (13) kapitol sa teda objavia niekedy v budúcnosti. Ako hodnotného Jaynesovho nástupcu som už medzičasom vybral Pearlovu knihu o kauzalite. Kniha spĺňa prvé Matúšovo kritérium čitateľnosti v tom, že si bere filozofov na paškál (a ešte viac vo svojej druhej edičnej inkarnácii). V recenziách na amazone sa môžete napríklad dozvedieť od filozofa vedy: “The second edition repeats the first edition verbatim, but at the end of most chapters there’s a clearly defined section dealing with subsequent developments. There’s a long chapter at the end that updates you on the replies to the first edition, and some helpful new material explaining things that were tricky the first time through. The updates are concise. Replies to philosophers (at least) are ultimately devastating, although Pearl could explain himself more fully.”Takisto na LessWrong navrhli nahradiť Platóna Pearlom vo filozofickom učebnom curriculu.

V určitom zmysle Pearlova monografia pokračuje, kde tá Jaynesova skončila. Chápanie teórie pravdepodobnosti ako rozšírenej logiky umožňuje jasne definovať mnohé koncepty, ktoré tradičnej štatistike unikajú. Jedným takýmto konceptom je kauzalita.

Je možné dospieť na základ pozorovaní, že A je príčinou pre B? Aký postup zvoliť? Je možné tento postup formalizovať a automatizovať? Tradičná štatistika pozná koncepty ako korelácia, kovariancia, nezávislosť dvoch premenných alebo konfundujúca premenná. Kauzalita však ostala pre štatistiku tabu. Väčšinou sa o nej dozviete len z varovaní a negatívnych výrokov o tom, čo pomocou štatistických konceptov nie je možné zistiť. Najznámejšia mantra hovorí, že korelácia neimplikuje kauzalitu – cum hoc, propter hoc. V následujúcom hurhaji okolo akademického upaľovania previnilca, však zanikne otázka, čo teda kauzalitu implikuje. Kauzalita, tak ako ostatné predstavy vyhodené na smetisko vedy ostala napospas filozofom.

Pearl je špecialistom na kauzalitu. Počas svojej akademickej kariéry navrhol spektrum metód a stratégii, ktoré riešia rôzne problémy vznikajúce pri analýzach kauzality. Pearl sa nezľakol kontroverzii a tabu spojených s inferenciou kauzality. Jeho dôležitým postrehom bolo, že ľudia inferujú kauzalitu celý čas a väčšinou sú v tom prekvapujúco úspešný. Pearlovými hlavnými nástrojmi je teória pravdepodobnosti, teória grafov a topológie. Jeho výskum tak spadá metodicky do oblasti AI a učenia strojov aj keď jeho implikácie a aplikácie sa týkajú prevažne štatisticky a filozofie. Jeho kniha Causality (Pearl, 2009) tvorí súhrn tohoto výskumu. Kniha nie je ľahké čítanie. Nie je to dané tým, že používa moc technický jazyk, alebo že by bola samotná téma veľmi zložitá. Matematika je jednoduchá avšak obsah knihy je silne našlapaný. Diskusia je obmedzená na minimum. Kapitoly sú vystavané na definíciách, teórémach, algoritmoch a poprípade ich dôkazoch a príkladoch aplikácie. Obsah je dobre štrukturovaný a vysvetlený. Je však natlačený, takže občas sa cítim už po piatich stranách vysilený a nepamätám si všetky definície takže musím listovať a vracať sa naspäť. Inak ide o nanájvyš zaujímavé čítanie, tak ako téma sľubuje.

Kauzalitou sa možno zaoberať v rôznych situáciách. V tomto článku sa obmedzím na situáciu, keď sú dané len pozorovania a nie je možné premenné experimentálne manipulovať. Pearl sa touto situáciou zaoberá v druhej kapitole. Inferencia v takýchto situáciách nie je nemožná. Akurát sme, podobne ako fyzici čakajúci na výbuch supernovy, odkázaný na priazeň prírody a výskyt prírodných experimentov, ktoré táto svojim vedeckým divákom ponúkne.

V tomto prípade nám ako formalizmus pre určenie kauzality postačia bayesiánske grafické modely, ktoré som už na tomto blogu predstavil. Videli sme, že grafický model vyjadruje podmienené súvislosti, ktoré určujú kauzálny vplyv.

Uzly reprezentujú udalosti/výroky/premenné a šípky znázorňujú podmienenosť. Z grafu je možné vyčítať pravdepodobnosť elementárnych situácii. Každý uzol prispeje jedným členom v multiplikácii p(M,P,D)=p(P)p(M|P)p(D|M,P). Z tejto pravdepodobnosti môžeme získať pomocou p(A)=\sum_Bp(A|B)p(B) a definície podmienenej pravdepodobnosti všetky ostatné pravdepodobnosti. Z grafu je takisto možné vyčítať  nezávislosť udalostí.

Nezávislosť je komplikovanejší koncept ako podmienenosť. Napríklad v grafe A \rightarrow C \rightarrow B síce neexistuje priamy šíp od A ku B avšak A podmieňuje B prostredníctvom C.  Následujúce pravidlo umožňuje určiť nezávislosť premenných v grafe: A a B sú navzájom nezávislé pre danú (pozorovanú) množinu premenných C (A \perp B | C ) ak všetky cesty v grafe medzi A a B obsahujú aspoň jeden z nasledujúcich prípadov.

1. Jednosmerka: a \rightarrow \dots \rightarrow c \rightarrow \dots \rightarrow b (tri bodky ilustrujú prítomnosť ďalší premenných, ich prítomnosť je však nepodstatná a v ďalšej diskusie ich vynechám) a uzol c je v množine C. Intuícia je nasledovná. Ak vysoký obsah vápnika (V) vo vode spôsobuje vodný kameň (K) a vodný kameň spôsobuje hučanie variča (H), tak hučanie variča je nezávislé od obsahu vápnika ak viem, že varič je zanesený vodným kameňom (V \perp H | K ) . Ako sme videli u Jaynesa nezávislosť vyjadruje informačnú nezávislosť. V našom príklade vyjadruje, že znalosť V nám nepovie nič nové o hučaní H ak vieme K – že varič je zanesený (alebo nie je zanesený). Ak by sme K nepoznali, množina C by bola prázdna a v tomto prípade by bolo H závislé od V. Smerovanie jednosmerky pritom nie je dôležité, keďže na poradí argumentov nezáleží A \perp B|C=B \perp A|C.

2. Rozchodník (spoločná príčina): a \leftarrow c \rightarrow b a c je v C. Podobne ako pri 1, ak poznám príčinu, znalosť a mi nepovie nič nové o b.

3. Stredisko (spoločný následok): a \rightarrow c \leftarrow b a c nie je v C. Kľúč od trezora majú len Anton a Boris. Ak viem, že niekto otvoril trezor (C) a dozviem sa, že to určite nebol Anton (A), tak automaticky viem, že ho otvoril Boris (B). Znalosť A nám teda povedala niečo o B ak zároveň poznáme C. Teda A a B sú závislé ak poznáme C. Možno trochu prekvapivo ak C nepoznáme, tak nemôžeme s istotou nič tvrdiť o B na základe A a tieto sú nezávislé.

Ak je množina C prázdna a A a B sú nezávislé hovoríme o nepodmienenej nezávislosti, v opačnom prípade o podmienenej.

Grafické modely (GM) sú abstraktnou reprezentáciou. Abstraktnejšou ako probabilistický model, ktorý je plne definovaný až keď určíme jeho parametrizáciu (na základe dát). a \rightarrow b teda pretavíme napríklad do b \sim \mathcal{N} (a,\sigma=2) a všeobecne pre každý uzol určíme funkčný vzťah x = f(pa_x). Kde pa_x sú rodičia x, teda premenné z ktorých smeruje šíp do x. Túto konkrétnejšiu reprezentáciu nazýva Pearl kauzálnym modelom, zatiaľčo v prípade GM hovorí o kauzálnej štruktúre.

Samozrejme v praxi graf nepoznáme. Poznáme dáta, prostredníctvom ktorých môžeme odhadnúť rozdelenie pravdepodobnosti. Preto nás zaujíma vzťah medzi pravdepodobnosťami (model) a grafickou reprezentáciou (štruktúra). Dôležitú rolu pritom hrajú nezávislostí v grafe. Nezávislosť premenných je možné identifikovať cez testovanie signifikantnosti. V prípade nezávislosti totiž platí p(A,B)=p(A)p(B) a môžeme testovať či sa náš odhad p(A,B) signifikantne líši od produktu p(A)p(B).

Vo všeobecnosti nemožno jednoznačne identifikovať na základe pravdepodobnosti graf, ktorý rozdelenie vygeneroval. Napríklad ak prešetríme na nezávislosť grafy A \rightarrow B \rightarrow C a A \leftarrow B \leftarrow C zistíme, že obidva vykazujú rovnaké nezávislosti. B a A sú nezávislé pre pozorované C. Všetky ostatné konfigurácie sú závislé. Z pravdepodobností preto môžeme vyčítať, čo Pearl nazýva vzor – graf ktorý je miešanina smerovaných šípov a spojení bez orientácie. Spojenia bez orientácie pritom vyjadrujú neistotu ohľadom smerovania a teda, že pri danom spojení sú obidva smery možné. Vzor získame pomocou nasledujúceho algoritmu.

V prvom kroku prešetríme všetky páry uzlov A,B. Ak sú A,B závislé pre všetky možné množiny C tak pridáme spojenie medzi A a B.

Vyššie sme videli, že pre jednosmerky nie je možné jednoznačne určiť smerovanie. To isté platí pre rozchodník. Situácia je iná pri stredisku. Strediská je možné identifikovať v grafe na základe nezávislostí. Ak sme v prvom kroku získali spojenie medzi A-C a medzi B-C a A,B sú nezávislé (žiadne spojenie), tejto konfigurácii zodpovedá len A \rightarrow C \leftarrow B. Pre každú inú orientáciu by museli byť A a B závislé.

Následne v treťom kroku sa snažíme nájsť orientáciu pre čo najviac zostávajúcich spojení. Pri tom využívame dva fakty. Po prvé, definícia vyžaduje aby bol graf acyklický. Pri konfiguráciách kde existuje len jediná acyklická alternatívna orientácia, túto musíme zvoliť. Po druhé, druhý krok vyčerpávajúco určuje strediská, preto žiadne ďalšie strediská nemôžeme do grafu pridať. Znova, pri konfiguráciách, kde existuje ku strediskám jediná alternatíva, zvolíme práve túto.

Tento algoritmus predpokladá, že všetky uzly sú pozorované. Situácia sa komplikuje ak povolíme prítomnosť nepozorovaných latentných premenných v našom modeli. V tomto prípade nie je možné jednoznačne určiť ani vzor definovaný vyššie. Napríklad graf MPD znázornený vyššie je schopný vygenerovať každé rozdelenie pravdepodobnosti vygenerované grafom M \rightarrow P  (Presnejšie pre každú parametrizáciu MP existuje parametrizácia MPD ktorá produkuje rovnaké rozdelenie pravdepodobnosti MP). Dôvod je evidentný – graf MPD zahŕňa MP. Riešenie je rovnako evidentné. S odvolaním sa na Ockhamovu britvu uprednostníme štruktúru s minimálnym počtom závislostí t.j. hrán v grafe. Následne môžeme upraviť algoritmus popísaný vyššie tak, že nám určí minimálny vzor s latentnými premennými. Pearl navrhol špeciálny vzor, ktorý reprezentuje latentné premenné ako hrany. Množinu uzlov tvoria pozorované premenné. Nasledujúce hrany sú možné. Skutočné príčiny A na B znázorňujú hrany A \rightarrow B . Nepravá súvislosť A \leftrightarrow B vyjadruje spoločnú latentnú príčinu A \leftarrow L \rightarrow B. Potenciálne príčiny  A \rightarrow^* B nechávajú dve vyššie uvedené možnosti otvorené. Buď ide o potenciálnu príčinu alebo nepravú súvislosť.

Konkrétny algoritmus na tomto mieste vynechám. Zaujímavé je jeho fungovanie v zredukovanom prípade, keď máme informáciu o časovom slede udalostí, teda o časovej organizácii premenných. V prípade časovej postupnosti totiž vieme, že budúce udalosti nemôžu mať vplyv na minulé udalosti. V tomto prípade sú všetky minulé udalosti potenciálnou príčinou pre všetky budúce udalosti. Vskutku definícia potenciálnej príčiny umožňujú formalizovať koncept štatistického času. Takýchto zoradení je v každom grafe viacej. Pearl vyjadril domnienku, že aspoň jeden zo štatistických časov bude zodpovedať tomu fyzikálnemu. Pearl však zároveň ukazuje že koncept času závisí od reprezentácie premenných a je možné nájsť ku každej reprezentácii, reprezentáciu, v ktorej funguje kauzalita opačne – z budúcnosti do minulosti. Otázku definície času, tak možno zredukovať na otázku definície problému. Bolo by napríklad zaujímavé vypracovať alternatívnu reprezentáciu pre štandardný model časticovej fyzike, kde čas beží opačne a uistiť sa, že táto reprezentácia je menej parsimónna.

Čo sa týka skutočných príčin, tieto okrem toho, že sú potenciálnymi príčinami, musia spĺňať dodatočnú podmienku, že ak má byť B príčinou C tak musí existovať (v čase predchádzajúca) premenná A pre ktorú platí  A \not \perp C a A \perp C| B. Inak povedané ak je B príčina C tak B zablokuje tok informácii od A ku C.

Nakoniec pre nepravý súvis platí že existuje predchádzajúce A, tak že A \not \perp B a A \perp C . Túto konfiguráciu možno vysvetliť tým, že A je spoločnou príčinou B \leftarrow A \rightarrow C a B nemá ďalší vplyv na C aj keď mu predchádza v čase. Inak povedané súvis medzi A a B existuje len v dôsledku tretej premennej a je preto nepravý.

Zhrniem. Rozdelenie pravdepodobnosti pozorovaných premenných samo o sebe neumožňuje určiť kauzálny súvis. Na to potrebujeme grafickú reprezentáciu bayesiánskych grafických modelov. Ak ju nepoznáme, čiastočne ju môžeme vypočítať z pozorovaných pravdepodobností. Pearl ukazuje ako. Komplikáciou je potenciálna prítomnosť neznámych latentných premenných v grafe. Naopak znalosť časovej postupnosti značne zjednodušuje inferenciu grafu a kauzality.

Pearl, J. (2009). Causality: models, reasoning and inference (2nd ed.). Cambridge University Press. Cambridge, UK.

Formálny model inferencie: Prípad časticovej fyziky

Mnohí vedci robia svoju prácu s nadšením, ktoré by bolo často možné aj klinicky diagnostikovať. Keď sa ich spýtate na predmet ich výskumu môže sa vám dostať výlevu aký by ste očakávali od básnika, ktorý sa po fľaši vína rozhovorí o svojich múzach. Napríklad z rozhovoru Weinberga pre nemecký Spiegel (môj preklad):

SPIEGEL: Keď vy alebo iný fyzici začnete hovoriť o teórii všetkého tak skôr, či neskôr padne slovo “krása”. Ako môže byť teória krásna?

Weinberg: V určitom zmysle sa to dá porovnať s pojmom krásy v hudbe: Ak počúvate Prelude od Chopina, tak cítite, že každý tón je správne zvolený. Žiadny iný by ho lepšie nenahradil.

SPIEGEL: Objektívna veda sa spolieha na subjektívne pocity?

Weinberg: Vskutku dokážeme vycítiť ak naše teórie obsahujú nejaký falošný tón. Samozrejme nie vždy sa v tom zhodneme. Následne sa sporíme tak ako sa ľudia sporia o tom či hudobnú skladbu možno vylepšiť. Ale v konečnom dôsledku je to jeho/jej nenahraditeľnosť, čo konkrétny tón alebo rovnicu robí krásnou. Keď počujete melódiu, ako opakuje frázu, tak cítite: Toto nemožno vylepšiť.

SPIEGEL: Hudba nepozná žiadne objektívne merítko, pomocou ktorého by sme mohli rozhodnúť, či je Mozartova hudba krajšia ako Chopinova alebo Schönbergova. Vo vašej vede však niečo také snáď existuje, či nie?

Weinberg: Testujeme teórie aby sme zistili či sú konzistentné s experimentami. Tým testujeme náš cit pre krásu – testujeme či sú naše teórie pravdivé. Pravda je niečo, k čomu v umení neexistuje žiadna paralela. V umení je otázka pravdivosti bezvýznamná.

SPIEGEL: Je pravda krásna?

Weinberg: Áno.

Podobné ódy na vedu možno nájsť u ďalších jej popularizátorov. Paradoxným vedľajším produktom je, že vedecký proces – proces vymýšľania teórii a experimentov alebo analýzy dát je vnímaní vedcami so spirituálnou bázňou. Čiže naturalizácia estetiky alebo naturalizácia náboženstva a spirituality sú v poriadku. No skúste vedcom navrhnúť, aby konečné postavili silikónového vedca a  proces naturalizácie narazí na odpor. Vedci, ich neobmedzená kreativita a intuícia pre krásu, sú predsa nenahraditeľní. Zrazu ani posledný dualistický kruhový argument nie je dosť zlý na to, aby vedci pomocou neho uchránili svoj flek a zdôvodnili svoju nepostrádateľnosť.

Ako som už spomínal pre štatistikov je tento konflikt záujmov obzvlášť relevantný keďže ich kolegovia z oblasti učenia stroje tak celkom nedomysleli svoje ciele do dôsledkov. Nedá mi nespomenúť Rainer Alexandrowitza, ktorý pár rokov dozadu zaskakoval na katedre psychologickéj metodiky na LMU v Mníchove. Alexandrovitz sa nám na jednej prednáške k modelovaniu štrukturálnych rovníc posťažoval ako jeho americký kolegovia prišli s návrhom tento proces modelovania automatizovať (SEM sú podmnožinou grafických modelov, takže nie je až také ťažké si to predstaviť). Ešte dnes sa musím smiať keď si spomeniem ako Alexandrovitz na prednáške rozhodil rukami a zvolal, že toto naozaj nechceme, lebo tak skončíme všetci nezamestnaní. Alexandrowitz mal aj špeciálny novotvar “substanzwissenschaftlich” (príslovka vyjadrujúca niečo ako “vedecky opodstatnene”). Substanzwissenschaftlich bolo treba argumentovať a pracovať tam kde formálne metódy definitívne končia. O tom, že niekde (a často aj konkrétne kde) končia nemal Alexadrowitz pochýb. V jeho ponímaní bolo dôležitou súčasťou vyúčby naučiť študentov umeniu štatistiky – ako riešiť problémy ktoré nemožno automatizovať.

Na rozdiel od kolegov vedcov a štatistikov, však my psychológovia máme eminentný záujem na tom a aby sa pri skúmaní, pri hľadaní teórii, návrhu experimentov a vyhodnocovaní dát v ľudskom mozgu žiadne zázraky nediali. Práca vedcov spočíva na psychologických mechanizmoch, na schopnostiach riešenia problémov a získania vhľadu. Ako takú chceme túto činnosť pochopiť a v konečnom dôsledku (v tom zmysle, že počítačové modely sú najlepším spôsobom teoretizovania) formalizovať. Prvé zaujímavé návrhy už existujú a v tomto článku chcem ukázať ako možno formalizovať proces hľadania optimálneho modelu v časticovej fyzike.

V časticovej fyzike tvoria dáta pozorovania reakcii – rozpadu a zrážok elementárnych častíc. Elementrárne častice sú nazývané častice, ktoré nie sú atómy ani jadrá atómov. (Výnimku tvorí protón – ktorý je jadrom atómu vodíka a zároveň elementárnou časticou.) Tabuľka vyššie uvádza značky hlavných 22 častíc. Ak vám tieto značky nič nehovoria, je najvyšší čas odskočiť si na wikipédiu a naučiť sa ich mená naspamäť. IHNEĎ!!!

Dáta teda tvoria pozorované reakcie – rozpad a zrážky častíc. Napríklad po zrážke dvoch protónov zostanú dva protóny a jeden pión. Mión sa rozpadá na elektrón, elektrónové neutríno a miónové antineutríno. Úlohou modelu časticovej fyziky je popísať pozorované a predpovedať nepozorované interakcie. Formálne môžeme definovať model ako klasifikátor, ktorý nám pri každej reakcii povie či je možná alebo nemožná. Zaujíma nás či existuje stratégia pre voľbu modelu ktorá by nám na základe pribúdajúcich pozorovaní umožnila nájsť optimálny model.

Pre optimálnu stratégiu existuje séria pozorovaní určitej dĺžky na základe ktorej nám naša stratégia vypľuje správny model – model ktorý klasifikuje všetky budúce pozorovania správne, inak povedané model, ktorý nebude falzifikovaný. Nie je ťažké ukázať, že takáto stratégia neexistuje. Množina možných serií pozorovaní je omnoho väčšia ako množina modelov a pre každý model možno skonštruovať príklad, ktorý model falzifikuje. Napríklad ak sme opakovane pozorovali interakciu p+p \rightarrow p+p+\pi^0 (I1) stratégia musí v určitom momente dospieť k modelu, ktorý predpovedá interakciu p+p \rightarrow p+p+\pi^0+\pi^0 (I2) ako nemožnú (inak sa stratégia nemôže naučiť správny model pre prípad že I1 platí a I2 nie). V tom momente však môže byť náš model falzifikovaný pozorovaním I2. Po určitom množstve pozorovaní I1 a I2 môžeme dospieť k modelu ktorý hovorí že I1 aj I2 sú správne. Tento model však zároveň musí klasifikovať I3: p+p \rightarrow p+p+\pi^0+\pi^0+\pi^0 . Pomocou takéhoto množenia piónov možno pre každý model zostrojiť prípad, ktorý model potenciálne falzifikuje. Tým pádom neexistuje stratégia ktorá by nám umožnila nájsť na základe pozorovaní model, ktorý bude definitívne správny. Problémom vyššie uvedeného príkladu je že nikdy nezískame negatívnu evidenciu o tom, že určitá reakcia je nepozorovateľná. Avšak aj v prípade, že presne určíme sadu možných a nemožných reakcii existuje nekonečné množstvo modelov, ktoré tieto pozorovania vysvetľujú a medzi ktorými sa musíme rozhodnúť.

Samozrejme fyzici našli a používajú konkrétny model – tzv. štandardný model časticovej fyziky. Ako sa k nemu dopracovali? Viackrát na tomto blogu sme videli, že neriešiteľné induktívne problémy sa stanú zrazu riešiteľnými ak pridáme apriori znalosti resp. zahrnieme do inferencie určité predpoklady. Podobne je tomu aj v časticovej fyzike. Fyzici vychádzajú z existencie konzervačných zákonov. Tieto postulujú, že určité kvantity sa pri reakciách zachovávajú. Tieto konzervačné zákony časticovej fyziky sú motivované úspechom dávnejšie známych konzervačných zákonov ako je zákon zachovania energie alebo zákon zachovania hybnosti. V prípade časticovej fyziky však často ich teoretická pozícia nie je až taká silná a ich jedinou úlohou je spraviť problém hľadania modelu časticovej fyziky riešiteľným. Feynman (1965, p. 67) si napríklad sťažuje na teoretickú neuspokojivosť baryonového čísla: ‘‘If charge is the source of a field, and baryon number does the same things in other respects it ought to be the source of a field too. Too bad that so far it does not seem to be, it is possible, but we do not know enough to be sure’’.  Tabuľka vyššie uvádza päť nezávislých kvantít ktoré sa pri reakciách zachovávajú: baryonové, leptónové, miónové a tau číslo + elektrický náboj. Model zároveň musí určiť konkrétne hodnoty týchto kvantít pre každú časticu. Tabuľka vyššie uvádza hodnoty pre štandardný model.

Konzervačné princípy značne zjednodušujú inferenciu možných reakcii. Napríklad sa môžeme vrátiť k prípadu I1 vyššie. Pión musí niesť nulovú hodnotu každej kvantity. Tým pádom môžeme na základe konzervačného princípu tvrdiť, že aj I2, I3 a vskutku všetky Ik pre ľubovoľné sú možné. (To ešte neznamená, že sú pozorovateľné, že boli pozorované, alebo že boli/budú pozorované s rovnakou frekvenciou pre všetky k.) Všeobecne môžeme zredukovať problém hľadania možných reakcii na hľadanie lineárnej bázy pre pozorované reakcie. Množinu všetkých možných reakcii tak získame ako lineárny uzáver (linear closure). Príklad: R1 a+a \rightarrow a+a+b+b a R2 a \rightarrow b boli pozorované. Tieto reakcie možno vyjadriť ako vektory (0,2) a (-1,1), kde prvá pozícia vyjadruje vznik/úbytok častíc a a druhá pozícia to isté pre časticu b . Množina všetkých možných reakcii je definovaná ako c(0,2) + d(-1,1) kde c a d sú celé čísla.

Konzervačné princípy umožňujú rozlíšiť nepozorované a nemožné reakcie a teda riešia problém s negatívnou evidenciou. Reakcie, ktoré nezachovávajú konzervované kvantity sú nemožné a naopak všetky ostatné sú možné:

There is an unwritten precept in modern physics, often facetiously referred to as Gell-Mann’s totalitarian principle, which states that ‘‘anything which is not prohibited is compulsory’’. Guided by this sort of argument we have made a number of remarkable discoveries from neutrinos to radio galaxies. (Bilaniuk & Sudarshan, 1969)

Samozrejme občas sa stane, že nemožné reakcie sú pozorované. Napríklad R1 a R2 implikujú, že q(a)=0, q(b)=0. Povedzme, že sme pozorovali reakciu R3 a \rightarrow c a náš model hovorí že q(c)=1. Táto reakcia nesmie existovať. To by znamenalo, že konzervované kvantity sme postulovali nesprávne. Takéto anomálie je však možné vysvetliť aj inak ako úpravou konzervačných zákonov. Môžeme postulovať výskyt nepozorovaných – t.j. skrytých častíc. R1 môžeme napríklad upraviť na R1b a+a \rightarrow a+a+b+b+d, kde d je nová skrytá častica. R1b, R2 a R3 existujú pre q(a)=1, q(b)=1, q(d)=-2 a pre vyžadované q(c)=1. Vo všeobecnosti, postulovanie skrytých častíc umožňuje vysvetliť existenciu určitých reakcii. Postulovanie skrytých častíc pre určité reakcie môže mať testovateľné implikácie pre ďalšie reakcie. Takisto s rozvojom experimentálnej technológie sa môžu stať skryté častice priamo alebo nepriamo pozorovateľnými. Ako slávne príklady môžu poslúžiť neutrína (postulované Paulim roku 1930) alebo Higgsov bozón (postulovaný Petrom Higgsom roku 1963). Graf nižšie ilustruje úspešnosť štandardného modelu pri predpovedaní existencie častíc a s nimi spojených konceptov.

Samozrejme mohlo to byť aj inak. Ak by sa nepodarilo nájsť Higgsov bozón bolo by potrebné prispôsobiť množinu postulovaných častíc a v extrémnom prípade aj prekopať konzervačné zákony. Toto spektrum siaha od jednoduchej modifikácie štandardného modelu až po jeho falzifikáciu a nahradenie iným modelom.

Nechajme však postulovanie nových častíc bokom. Predpokladajme že všetky pozorované reakcie častíc majú konzistentnú interpretáciu. Ako nájsť správne konzervačné zákony, ktoré takúto interpretáciu umožňujú? Tento problém je znova ľahko riešiteľný pomocou lineárnej algebry. Zachovávané kvantity tvoria lineáne uzavretý priestor vektorov. Napríklad môžeme definovať Šimkovicove číslo ako baryonové  + miónové číslo (B a M kvantity v tabuľke). Je jasné, že ak sú miónové číslo a baryonové číslo zachovávané, tak reakcie zachovávajú aj Šimkovicove číslo. Našou úlohou je tak nájsť bázu tohoto lineárne priestoru. Konkrétne tento priestor tvorí ortogonálny komplement priestoru možných reakcii.

V tomto článku nás zaujímajú dve otázky. Po prvé nakoľko zodpovedá vyššie popísaná stratégia spôsobu, ktorým fyzici dospeli k svojmu súčasnému modelu t.j. štandardnému modelu. Umožňuje ďalšie lepšie modely, resp. ďalšie v predpovediach ekvivalentné rmodely? Po druhé na koľko je táto stratégia optimálna? Existujú apriórne princípy ktoré hovoria v prospech vyššie popísaného formalizmu lineárnej algebry.

Schulte (2008) implementoval vyššie popísanú stratégiu hľadania modelov. Ako dáta vyextrahoval 205 nezávislých reakcii z literatúry pre 182 známych častíc. Veľkú časť týchto dát tvoria informácie o rozpade individuálnych častíc, ktoré zhŕňa a publikuje Annual Review of Particle Physics. (Dáta a programy nájdete tu.) Schulteho program produkuje riešenia ktoré sú empiricky ekvivalentné štandardnému modelu – t.j. predpovedajú presne tie isté množiny správnych a nesprávnych reakcii. Tieto riešenia sa však môžu rozchádzať čo sa týka definície konkrétnych kvantít. Technicky vzaté môžeme nájsť viaceré bázy, ktoré definujú ortogonálny komplement k priestoru reakcii. Napríklad model zachovavájúci miónové, tau, elektrónové a Šimkovicovo číslo tvorí tiež bázu. (Náboj častice – C, je z veľkej časti daný cez zákon zachovania elektrického náboja a v rovniciach ho môžeme reprezentovať ako danú nezávislú kvantitu, preto túto kvantitu v ďalšej diskusii opomeniem.). Tento model je ekvivalentný k štandardnému modelu v tom zmysle, že predpovedá rovnaké reakcie. Prečo by sme teda mali preferovať štandardný model pred tým Šimkovicovským? Konzervované kvantity štandardného modelu definujú vlastnosti častíc a takisto rodiny častíc (baryónová, miónová, tau a elektrónová rodina). Ak je definícia kvantít ľubovoľná (v zmysle že existujú iné ekvivalentné definície), tak je aj ontológia častíc postulovaná štandardným modelom ľubovoľná, či nie?

V prvom rade treba dodať, že všetky riešenia, ktoré Schulteho program produkuje rešpektujú rozdelenie častíc na častice a antičastice. V tabuľke vyššie si môžete všimnúť, že pri každej kvantite možno nájsť pár s pozitívnym a negatívnym znamienkom. Tento fenomén nájdeme v prípade každej bázy, v prípade každého empiricky optimálneho modelu. Ďalej treba dodať, že môžeme použiť ďalšie neempirické princípy na to, aby sme vybrali z ekvivalentných modelov. Weinberg hovoril o kráse. My môžeme hovoriť o jednoduchosti. Napríklad ak si predstavíte v tabuľke stĺpec pre Šimkovicove číslo (B+M) tak tento bude obsahovať 10 nenulových hodnôt. Stĺpec pre baryonové číslo je jednoduchší a krajší v tom zmysle že obsahuje menej nenulových hodnôt. Vskutku Schulte zistil, že ak minimalizujeme počet nenulových hodnôt ako sekundárne kritérium tak získame štandardný model ako unikátne riešenie! Ďalším atraktívnym faktom je že nenulové hodnoty pre stĺpce B,M,E,T tvoria exkluzívne skupiny Žiadny riadok (častica) neobsahuje dve nenulové hodnoty. Tým je možné rozdeliť častice do rodín, pre ktoré možno následne hľadať nezávisle fundamentálnejšie princípy (napríklad ako kvarky tvoria baryóny).

Schulteho algoritmus modeluje hľadanie štandardného modelu ako sa tomu dialo vo fyzike v 60., 70. rokoch, keď hlavnými indíciami boli reakcie. Aj vtedy však už existovali nezávislé princípy ktoré umožňovali uprednostniť určitý model. Napríklad, ak si zoradíme častice podľa ich hmotnosti tak uvidíme obrovskú priepasť medzi hmotnosťou baryónov (ťažké) a leptónov. Toto pozorovanie tvorí nezávislú evidenciu pre vytvorenie baryónovej rodiny častíc. Takisto Schulteho dáta nezahŕňajú určité anomálie, ako napríklad oscilácie neutrín – reakcie popierajúce konzervačné princípy štandardného modelu. Pointa je v tom, že všetky tieto dodatočné zdroje informácii a pochybností by sme mohli zahrnúť. Zaujímavé je, že aj bez nich algoritmus unikátne identifikuje štandardný model.

Vyššie uvedené výpočty štandardného modelu pomocou lineárnej algebry sme viac-menej vytiahli z rukáva. Je možné toto riešenie podložiť nejakým konceptom optimality?  Vskutku Schulte (2000,2008) ukázal, že metóda výpočtu tvorí v určitom zmysle optimálnu a jedinú optimálnu stratégiu. Tento koncept optimality funguje na snahe minimalizovať počet falzifikácii modelu než konvergujeme k správnemu modelu. Snažíme sa dopracovať k riešeniu bez toho aby sme často menili náš názor na to ktorý model je v danom čase, pri danej evidencii správny. Najlepšou takouto stratégiou je v každom kroku vytvoriť minimálnu teóriu zahŕňajúcu a vysvetľujúcu súčasné pozorovania. Toto je presne to čo robí vyššie citovaný Gell-Mannov totalitaristický princíp. Súčasné pozorovania implikujú určitú množinu možných pozorovaní. Všetky ostatné pozorovania sú nemožné. Schulte ukázal, že táto stratégia garantuje  existenciu konečného worst-case počtu zmien názoru pre každú sériu pozorovaní. Inak povedané metóda garantuje konvergenciu (ak správne riešenie existuje).

Podobným spôsobom sa možno pozrieť aj na historický proces objavovania modelov v chémii, kde sú často reakcie reprezentované vo forme rovníc. Všeobecnejšie možno Schulteho princíp minimalizácie zmien názoru v priebehu jeho hľadania správneho modelu identifikovať so “silnou inferenciou” Johna Platta. Platt (1964) sa pozastavil nad systematickosťou a nekompromisnosťou experimentovania a teoretizovania v časticovej fyzike a v molekulárnej biológii, ktoré viedli k obrovskému pokroku v týchto oblastiach v 60. a 70. rokoch. Tento sa vyznačoval práve tým, že sa snažil minimalizovať počet krokov, ktoré vedci museli podstúpiť na ceste k správnemu modelu. Platt srdečne odporučil tento spôsob silnej inferencie vedcom v sociálnych vedách. Jeho nápad nemôže fungovať. Štatistická neistota výsledkom pritom nie je hlavným problémom. Teoreticky môžeme zvýšiť počet pozorovaní/probantov a opakovane replikovať experiment tak, že pravdepodobnosť daného výsledku sa bude blížiť k istote. Viaceré súčasné replikačné iniciatívy v psychológii sa uberajú týmto smerom. Silná inferencia v psychológii nemôže fungovať, lebo predmet výskumu nie je možné rozkúskovať na atomárne binárne (platné/neplatné) hypotézy.  V tomto ducha sa niesla Newellova kritika experimentálnej psychológie, ktorej argumenty zhŕňa môj starší článok.

Norbert Bischof zvykol poznamenať, že psychológovia nie sú hlúpejší ako fyzici. Fyzici mali šťastie, že im výsledky v podstate padli do náruče bez väčšieho snaženia. Videli sme ako pomocou matematických formalizmov možno dodatočne zdôvodniť postup akým sa generácie fyzikou dopracovali k štandardnému modelu časticovej fyziky. Inferencia v psychológii je naproti tomu omnoho ťažšia. Vskutku nie je vôbec jasné akým smerom by sa mala inferencia v psychológii uberať. Myslím, že toto je dobrá príležitosť postaviť kozu pred voz a formálne vypracovať optimálnu inferenčnú stratégiu predtým než začneme pumpovať zdroje do zberu dát.

Bilaniuk, O.-M., & Sudarshan, E. C. G. (1969). Particles beyond the light barrier. Physics Today, 22, 43–52.

Feynman, R. (1965). The character of physical law (1990 ed., Vol. 19). Cambridge, MA: MIT Press.

Platt, J. R. (1964). Strong inference. Science, 146(3642), 347-353.

Schulte, O. (2000). Inferring conservation laws in particle physics: A case study in the problem of induction. The British Journal for the Philosophy of Science, 51, 771–806.

Schulte, O. (2008). The co-discovery of conservation laws and particle families. Studies In History and Philosophy of Science Part B: Studies In History and Philosophy of Modern Physics, 39(2), 288-314.

fMRI a psychologický výskum

V deväťdesiatich rokoch sa na scéne objavila nová technológia s potenciálom zásadne zmeniť výskumu ľudskej mysle. Funkcionálna magnetická rezonancia umožňuje kvantifikovať prietok krvy v mozgu. Prietok krvi danej oblasti mozgu možno následne použiť ako indikátor využitia tejto oblasti v určitom časovom rozmedzí. Ak inferenciu otočíme tak nám fMRI umožňuje určiť oblasť mozgu, ktorá je aktivovaná. Ďalej, ak naši probanti v priebehu rôznych časových úsekov vykonávajú určitú aktivitu, dozvieme sa, ktoré aktivity sú spojené s ktorými oblasťami mozgu. Bingo! Môžeme isť mapovať mozog.

fMRI poskytuje dobré priestorové rozlíšenie (1-125 kubických milimetrov) a použiteľné časové rozlíšenie (2-3 sekundy pre jednu 3D fotku mozgu). Revolučnosť tejto techniky si môžeme uvedomiť až keď sa pozrieme na akej evidencii spočíval výskum pred zavedením fMRI. Napríklad Milner a Goodale vo svojej knihe o vizuálnom spracovávaní v mozgu (1995) diskutovali nasledujúcu evidenciu. Prvá kapitola bola venovaná neurobiologickým experimentom s primátmi (prevažne merania akčných potenciálov neurónov u opíc). Tri kapitoly boli venované neuropsychologickým poruchám mozgu a záverečná kapitola bola venovaná behaviorálnym experimentom so zdravými ľudmi. Táto kapitola sa zároveň snažila argumentovať, že poznatky z predchádzajúcich kapitol sú relevantné pre teóriu o vizuálnom vnímaní u zdravých ľudských jedincov a teda pre teóriu vizuálneho vnímania všeobecne. Takýto induktívny skok v tom čase vôbec nebol samozrejmý. Bolo známe, že anatomická architektúra mozgu primátov a ľudí je v prípade vizuálneho laloku podobná, avšak či aj funcionálne rozdelenie (teda ktorá oblasť vykonáva aké úlohu) je rovnaké to nevedel nikto, keďže funkčné vlastnosti rôznych oblastí mozgu u ľudí neboli známe. (Zopár málo indícii poskytli Penfieldove experimenty s priamou elektrickou stimuláciou mozgu u epileptických pacientov.) S pomocou fMRI sa podarilo preukázať, že vizuálne spracovávanie v mozgu človeka a a ľudoopov sú si veľmi podobné. Podobne sa podarilo doložiť ďalšie poznatky z výskumu pamäte, učenia, pozornosti a ďalších psychologických funkcii.

fMRI nielenže potvrdila známe veci ale viedla k novým poznatkom a k teoretickému pokroku, ktorý by bol pomocou kombinácie behaviorálnych techník, klinickej neuropsychológie, neurológie a výskumu na primátoch ťažko možný. fMRI výskum napríklad podkopal modularistické teoretizovanie dominantné v 80. a 90. rokoch reflektujúce behaviorálnu a neurologickú evidenciu. Ako príklad možno uviesť gramatický modul.

Jednou z vlastností modulov postulovaných Fodorom (1983) bol ich spoločný “neurálny substrát”. fMRI pomohlo lokalizovať viaceré úlohy ktoré mal plniť gramatický modul (Blumstein & Amso, 2013). Reč, syntaktické, sémantické a lexikálne úlohy sú lokalizované vo viacerých odlišných oblastiach mozgu. To by nemuselo byť tragické, akurát niektoré oblasti sa venujú viacerým úlohám, pre ktoré boli postulované odlišné moduly. Napríklad predný spodný lalok (IFG) bol usvedčený z aktivity v štúdiách semantiky a syntaxi jazyka, porozumenia reči a transformácie lexikálneho obsahu do vetnej formy. Ešte horšie sú presahy medzi linguistickými a kognitívnymi funkciami. Oblasť STS padla do podozrenia v štúdiách vnímania reči, vnímanie tváre, biologického pohybu, teórie mysle a audiovizuálnej integrácie. K tomu môžeme ešte pridať fMRI štúdie so slepými a afazickými pacientmi. Napríklad u slepých jedincov sú časti vizuálnej kôry užívané pre spracovávanie rečových signálov. Tieto poznatky podkopávajú predstavu modulárneho rozdelenia mysle.

Ďalšou peknou ilustráciou užitočnosti fMRI je výskum pamäte u seniorov (Park & McDonough, 2013). S príchodom staroby pamäťové schopnosti klesajú. Seniori si pamätajú menej po kratšiu dobu. Pred vstupom fMRI na scénu si to vedci predstavovali tak, že pamäťové zdroje s vekom klesajú. Niečo ako hard-disk, ktorého kapacita vekom klesá. fMRI výskum viedol k oveľa diferencovanejšej perspektíve. V prvom rade sa zistilo, že aktivita vo frontálnych areáloch mozgu je vyššia u seniorov. Avšak to platí len pre úlohy do určitého stupňa náročnosti. Vyššia aktivita vo frontálnych oblastiach naznačuje, že seniori používajú vyššie kognitívne funkcie na to aby kompenzovali pamäťové deficity aj v jednoduchších úlohách. K tomu dobre pasuje evidencia, že vo vnemových oblastiach je aktivita počas  pamäťových úloh u seniorov znížená. fMRI tak ukázalo presun aktivity z vnemových do vyšších kognitívnych oblastí mozgu. Takýto výskum má dôležité implikácie pre diagnostiku pamäťových deficitov pomocou behaviorálnych úloh. Napr. v mnohých jednoduchých pamäťových úlohách sa nepodarilo preukázať výkonnostné rozdiely medzi seniormi a študentmi. fMRI výskum ukázal, že to nemusí znamenať, že takéto rozdiely neexistujú. Pri ľahkých úlohách sú seniori schopní kompenzovať a vynulovať svoje deficity pomocou zapnutia vyšších kognitívnych stratégii. Pre diagnostikovanie je preto dôležité použiť úlohy rôznej náročnosti a pri odhade deficitov treba zohľadniť vplyv kompenzačných kognitívnych stratégii.

Ako posledný príklad uvediem výskum vnímania bolesti (Wager & Atlas, 2013). Behaviorálny výskum bolesti má jeden zásadný problém. Na implicitné alebo explicitné odhady bolesti v podaní probantov a pacientov vplývajú rôzne sociálne faktory, ktoré ťažko izolovať a odlíšiť. Napríklad ak dáme probantovi tabletku a ten nám povie, že už sa cíti lepšie povedal to preto aby nepôsobil ako nevďačník? Cíti sa naozaj lepšie alebo zafungoval u neho placebo efekt? fMRI umožňuje tieto faktory rozpliesť. Podarilo sa preukázať, že placebo vedie k zníženej aktivite v oblastiach mozgu spájanými s vnímaním bolesti. Stupeň redukcie aktivity súvisí so subjektívne vnímanou úľavou. Táto úľava je zrejme sprostredkovaná endogénne podmieneným vylučovaním opiátov v strednom mozgu a v mozgovom kmeni, keďže medikamenty zabraňujúce vylučovaniu opiátov znižujú účinnosť placeba. fMRI doložilo zvýšenú aktivitu v týchto oblastiach po požití placeba. Ďalšie štúdie preukázali, že nasmerovanie pozornosti na úľavu (napríklad na presvedčovanie seba typu “Myslím, že sa už cítim lepšie, ale naozaj sa cítim lepšie, už som skoro zdravý”) nie je potrebné na to, aby placebo fungovalo. V tomto prípade išlo o behaviorálne štúdie. Tieto však boli motivované pozorovaním aktivácie oblastí spájaných s nasmerovaním pozornosti v štúdiách placeba. Nakoniec, aj keď placebo funguje na báze opiátov vzory aktivácie pozorované pri placebe sú odlišné od vplyvu medikamentov podporujúcich vylučovanie opiátov, čo pasuje k pozorovanej aditívnosti efektu medikamentov a placeba na vnímanie bolesti.

Kontroverzie

Napriek takýmto deklarovaným úspechom sa objavili ohľadom fMRI výskumu viaceré otázniky a kontroverzie. Obraz fMRI ako priameho okna do fungovania mozgu je veľmi zjednodušený. fMRI poskytuje neurobiologický signál, ktorý musí byť doplnený správnou experimentálnou manipuláciou a štatistickou analýzou, aby sme z neho mohli niečo o fungovaní mozgu dozvedieť. Týmto problémom čelia aj behaviorálne merania a fMRI sa tak môže oprieť o experimentálne manipulácie overené behaviorálnym výskumom. Čo sa týka štatistického vyhodnocovania dát tu čelia vedci čiastočne novým problémom spojeným so správnou analýzou vysoko-dimenzionálnych dát, ktoré fMRI poskytuje. Mnohokrát sú však tieto problémy vedcami vzorne zvládnuté, no pri šírení publikovaného výskumu médiami k verejnosti sa tieto detaily stratia čo vedie ku kontroverzným správam v tlači o blikajúcich mozgoch.

1. Čo meria fMRI?

Mozog a neuroný potrebujú na svoje fungovanie energiu, ktorá je dodávaná do mozgu okysličenou krvou napríklad v podobe cukrov. Prietok okysličenej krvi v mozgu je modulovaný neurálnou aktivitou v rôznych oblastiach. fMRI meria prietok okysličenej krvi v mozgu, takzvaný BOLD (blood-oxygen-level-dependent) signál . Induktívnym skokom je v fMRI štúdiách BOLD signál identifikovaný s neurálnou aktivitou. Mechanizmy, ktoré ovplyvňujú prietok krvi v mozgu stále nie sú dostatočne známe a sú oblasťou aktívneho výskumu. Viaceré faktory okrem neurálnej aktivity môžu ovplyvniť BOLD signál. BOLD reflektuje neurálnu aktivitu s časovým posunom a značným rozptylom. BOLD signál možno rozoznať 2-10 sekundy po aktivite neurónov a dosahuje maximum po 5 sekundách. Krvné cievy nie sú rozdelené rovnomerne po celom mozgu. Prietok je vyšší v oblastiach veľkých tepien. To môže viesť k celkovo vyššej BOLD aktivite v oblastiach mozgu, ktoré sú v blízkosti veľkých tepien. To je zrejme prípad notoricky aktívnych lingvistických oblastí v blízkosti mediálnej mozgovej tepny. Nakoniec, BOLD signál nie je modulovaný len aktivitou neurónov v danej oblasti, ale mozog sa snaží predpovedať aktivitu neurónov a zabezpečiť prísun krvi do danej oblasti ešte skôr než k nej dôjde (Cardoso et al., 2012). To znamená, že napríklad pri vizuálnom vnímaní prietok krvi v okcipitálnych vizuálnych oblastiach reflektuje nielen viditeľnosť stimulu na monitore ale aj očakávanie, že sa stimulus na monitore zjaví. K týmto výsledkom sa možno dopracovať paralelným meraním aktivity neurónov a BOLD-signálu u opíc. Ak máme k dispozícii len BOLD signál nemáme možnosť tieto dva faktory rozlíšiť.

2. Priame uzávery: Psychológia -> Mozog

Ak chcete študovať ako mozog funguje napr. pri pamäťovej úlohe a posadíte zdravého probanta do skeneru a zmeriate jeho mozgovú aktivitu zistíte, neprekvapivo, že celý mozog je aktívny. Jednotlivé merania samé o sebe sú ťažko interpretovatelné. fMRI štúdie, preto vždy pracujú s kontrastmi medzi aktivitou v rôznych úlohách úloh. Napríklad internetový portál austrálskej ABC priniesol správu o tom, že “vedci zistili, že ženský hlas aktivuje sluchové oblasti mozgu, zatialčo mužský hlas aktivuje oblasť v zadnej časti mozgu nazývanú tiež oko mysle”. Samozrejme aj mužský hlas aktivuje sluchové oblasti mozgu – inak by sme ho nemohli počuť. Štúdia v skutočnosti skúmala kontrasty v aktivácii medzi dvoma úlohami. Vedci púšťali probandov v skeneri v určitých intervaloch a v náhodnom poradí nahrávky ženského a mužského hlasu. Vedci potom porovnali aktiváciu mozgu pri počúvaní mužského a ženského hlasu a informovali o tom, ktoré oblasti vykazujú signifikantne rozdielnu aktiváciu. Výber experimentálnej manipulácie a materiálu je kritický. Vo vyššie uvedenom prípade musí byť stimulus identický, čo sa týka všemožných faktorov. Líšiť sa môže len čo sa týka pohlavia hlasu. Nahrávky musia mať v oboch prípadoch rovnakú dĺžku, rovnaký obsah, hlasitosť, intonáciu … Tieto detaily sú dôležité pre správnu interpretáciu získaných výsledkov.

3. Spätné uzávery: Mozog -> Psychológia

V poslednom odstavci sme vychádzali zo situácie, že probandi dostali určitú úlohu a my sme skúmali aktivitu mozgu. Napríklad probandi dostali linguistickú úlohu a porovnali sme ju podobne náročnou nelinguistickou úlohou. Linguistická úloha aktivovala oblasť X. Následne prevedieme štúdiu pamäte a zistíme, že okrem očakávanej oblasti Y bola aktivovaná aj oblasť X. Môžeme skočiť k záveru, že probandi na vyriešenie úlohy využívali lingvistické funkcie – napríklad, že si v duchu opakovali názvy objektov, ktoré si mali zapamätať? Takýto záver je problematický. Oblasť X nemusí byť aktivovaná len pri lingvistických úlohách ale má napríklad dodatočný význam pre fungovanie pamäte alebo nejakej tretej neznámej funkcie. Dôležité je zvážiť vzory aktivácie naprieč publikovanou literatúrou. Poldrack (2006) napríklad porovnal údaje z 3222 kontrastov (celkovo 749 publikovaných štúdii) ohľadom aktivácie určitej oblasti – volajme ju X. V 869 prípadoch sa kontrasty týkali lingvistickej úlohy. Z toho v 166 prípadoch bola oblasť X aktivovaná. Zvyšných 2353 kontrastov sa zaoberalo nelingvistickými funkciami. Z toho v 199 prípadoch bola oblasť X aktivovaná. Oblasť X teda nie je výlučne aktivovaná v lingvistických úlohách. Vskutku kvôli prítomnosti šumu a štatistickej chyby takúto oblasť naprieč akumulovanou literatúrou prakticky nenájdeme. Prípad spätnej inferencie však nie je stratený. Môžeme použiť Bayesovu vetu, aby sme kvantifikovali evidenciu, že aktivácia oblasti X reprezentuje lingvistické funkcie.

p(L|X)= \frac{p(X|L) p(L)}{p(X|L) p(L)+ p(X|!L) p(!L)}= \frac{166/869}{166/869+199/2353}=0.69

kde L je lingvistická štúdia, X je aktivácia oblasti X a p(L)=p(!L)=0.5. Evidenciu môžeme interpretovať cez Bayes faktor BF = p(L|X)/(1-p(L|X))= 2.23. Bayes faktor vyjadruje pomer evidencie – v akom pomere je zapojenie lingvistických schopností pravdepodobnejšie ako ich nezapojenie. V bayesiánskej terminológii tvorí Bayes faktor 1<BF<3 slabú evidenciu. Pozorovanie aktivácie oblasti X teda poskytuje slabú evidenciu pre zapojenie lingvistických schopností v danej úlohe.

Ako vidieť na príklade vyššie takéto závery závisia od celej literatúry. Dostupné databázy fMRI (z ktorých vychádzal aj Poldrack pre svoj výpočet frekvencii) sú nekompletné a obsahujú len informácie z publikovaných zhrnutí. Na to aby sme aplikovali podobnú analýzy na jednotlivé voxely je potrebné mať prístup k samotným dátam. Predchádzajúce snahy o sprístupnenie fMRI dát žalostne zlyhali (Van Horn & Gazzaniga, 2012). Praktická užitočnosť Poldrackovej metódy je tak značne redukovaná na zopár hrubozrnných prípadov. To znamená, že spätné uzávery sú problematické a vyžadujú dodatočnú argumentáciu v prospech špecifickosti aktivácie diskutovaných oblastí.

4. Funkčná ontológia

Ak sledujeme fMRI výsledky naprieč štúdiami zistíme, že konkrétna psychologická funkcia je lokalizovaná v rôznych často aj odľahlých oblastiach mozgu. Naopak určitá oblasť môže byť aktivovaná dvomi rozličnými funkciami. Otázne je nakoľko je súčasná kategorizácia výskumu na psychologické funkcie (pamäť, pozornosť, reč, kategorizácia, vhľad …) vhodná? Ak takáto kategorizácia vedie k zmätku v fMRI dátach, nemali by sme ju hodiť cez palubu a prijsť s novou vhodnejšou kategorizáciou?

V prvom rade vymyslieť kategorizáciu funkcii na prvý pohľad konzistentnú s fMRI dátami nie je až také ťažké. Napríklad Poldrack (2010) ukázal ako by frenológovia v 19. storočí nemali problém doložiť svoje postulované mozgové funkcie pomocou fMRI výskumu. To znamená, že konzistentnosť fMRI dát s kategóriami nie je dostatočná pre validáciu daných kategórii, ale musí byť doložená úvahami o presnosti a špecificite mapovania psychologických funkcii na oblasti mozgu a naspäť. Ako obstojí súčasný systém kategorizácie pri takýchto úvahách? Jemnozrnné testovanie presnosti a špecifickosti nie je možné z dôvodov spomenutých v predchádzajúcom odstavci. Poldrack (2010) však ukázal, že aspoň v prípade hrubozrnných funkcii ako pamäť, multi-tasking, inhibícia správania alebo reč dokáže fMRI celkom dobre diskriminovať. Napríklad reč je možné odlíšiť od inhibície s 80% úspešnosťou, zatiaľčo inhibíciu a multi-tasking s úspešnosťou 60 %.

Na druhej strane problému, stojíme pred otázkou ako charakterizovať aktivácie? Ako definovať identické aktivácie? Možno intepretovať signifikantnú aktiváciu voxelu (12,37,22) v prvom experimente a aktivácia voxelu (13,37,22) v druhom experimente ako aktiváciu rovnakej oblasti? Odpovedať na túto otázku je najľahšie pomocou neuroanatomických poznatkov o konektivite a kompaktností určitých oblastí. V mozgu je však viac-menej spojené všetko so všetkým a tak aj takéto neuroanatomické argumenty sú mnohokrát kontroverzné. Tým sa naskytá otázka či by nebolo vhodnejšie zvoliť iné jednotky aktivácie ako populárne priestorovo definované oblasti. Jedným trendom v fMRI literatúre je postupný prechod od lokalizačných štúdii k výskumu konektivity,  súčinnosti a interakcie oblastí po celom mozgu. Napriek nejasností ohľadom priestorovej definície oblasti aktivácie, však lokalizačné štúdie stále ostávajú dominantnou paradigmou fMRI.

5 Štatistika

Ako som spomenul vyššie, dáta zo skenera treba brať ako signál a nie ako fotky mozgu. Tento signál je nevyhnutné očistiť od šumu spôsobeného všetkým možným od nepresností meracieho prístroja (skenera) až po aktivitu mozgu reprezentujúcu nežiadúce behaviorálne artefakty (pohyb probanta v skenery). Najčastejšou technikou na očistenie signálu je spriemerovanie viacerých meraní. To znamená, že probant musí sedieť v skenery po dlhšiu dobu a v koordinovaných časových odstupoch opakovať danú úlohu.  Fotky mozgu sú zároveň transformované na priemerný mozog a priemerované naprieč vzorkou (väčšinou 10-20) probandov. Výsledkom je jedna priemerná fotka aktivácie mozgu.

5.1 Mŕtvy losos

Následne vedci hľadajú oblasti mozgu, ktoré sú signifikantne aktívne. Štatistická signifikantnosť je rátaná pomocou štandardných frekventistických metód (pričom relevantná je variabilita naprieč vzorkou probandov) pre každý voxel. Ako bolo spomenuté, množstvo voxelov pri skenovaní je enormné a ak by sme signifikatnosť vyhodnocovali na nominálnej úrovni p=0.05 tak získame obrovské množštvo signifikantne aktívnych oblastí, roztrúsených po celom mozgu. Riešením je korigovať nominálnu prahovú hodnotu p, tak aby sa zamedzilo alfa chybe na reálnej úrovni .05.

Ako správne zvoliť nominálnu hodnotu p? Nebudem zachádzať do detailov. Dôležité je, že mnohé štúdie používajú neadekvátne ad-hoc metódy korekcie nominálnej p hodnoty, čo možno odhaliť v počítačových simuláciách náhodných fMRI dát. Podobnú simuláciu možno previesť aj so spusteným skenerom. Bennett et al. (2009) chceli otestovať skener a softvér pre analýzu dát. Zrejme sa nikomu z labáku nechcelo do skenera, tak použili namiesto ľudského probanta mŕtveho lososa. Na svoje prekvapenie autori našli signifikantnú aktiváciu v oblasti, kde sa nachádza mozog lososa. Tieto signifikantné analýzy použili p=0.001. Autori ukázali, že sila aktivácie koreluje s variabilitou aktivácie (naprieč opakovanými meraniami, losos absolvoval 160 opakovaní). To znamená, že silne aktivované voxely sú aj viac volatilné a menej spoľahlivé. Štatistické metódy, ktoré adaptujú nominálnu p hodnotu na základe volatility pre každý voxel existujú a ich aplikácia nenašla žiadnu signifikantne aktívnu oblasť v tele mŕtveho lososa. Žiaľ mnohé publikované štúdie používajú neadekvátne metódy pre voľbu nominálnej p hodnoty.

5.2 Voodoo korelácie

Štatistické analýzy spomenuté v odstavcoch vyššie nám povedia, či a ktorá oblasť je signifikantne aktívna v danej úlohe. Štatistická signifikantnosť sa snaží vyjadriť spoľahlivosť daného efektu. Nás však zaujíma aj sila tohoto efektu v závislosti od úlohy. Napríklad Eisenberger, Lieberman, a Williams (2003) merali fMRI aktivitu zatiaľčo v probantoch bol evokovaný pocit sociálneho odmietnutia vo vnútri skenera. Po dokončení experimentu sa autori pýtali probandov nakoľko ich experiment rozrušil. Autori chceli zistiť nakoľko zodpovedá sila aktivácie (v signifikantne aktívnych oblastiach) ich (priznanej) emocionálnej reakcii. Autori našli koreláciu r=.88, čo je veľmi silná korelácia na psychologickú štúdiu. Vul et al. (2009) as pýtali ako je možné že takéto obrovské korelácie existujú? Problém je v tom, že korelácia nemôže presiahnuť reliabilitu samotných meracích prístrojov. Ak mám prístroj, ktorý predpovie dážď ďalší deň v 80 % prípadoch správne a pristroj, ktorý predpovie, že Anton si zoberie ďalší deň dáždnik v 70% percent prípadoch správne, tak korelácia medzi dažďom a Antonovym dáždnikom nemôže byť vyššia ako \sqrt{0.8 \times 0.7}=0.74. V prípade korelácie r=.88 fMRI aktivity a stupňa rozrušenia by pri stopercentnej spoľahlivosti fMRI musela byť reliabilita indikátora stupňa rozrušenia minimálne 0.78. To je úroveň reliability ktorú dosahujú testy IQ alebo testy osobnosti, ktoré boli mnohokrát validované, prešli desaťročiami vývoja a používajú široké spektrum úloh a otázok. Dotazník s piatimi otázkami na tému rozrušenia zbúchaný na kolene medzi experimentami, takúto validitu nikdy nedosiahne. Takéto vysoké korelácie možno nájsť vo viacerých publikovaných prácach. Popis metodiky v publikáciach konkrétnu informáciu ako boli korelácie získané neposkytujú. Vul et al. sa preto obrátili emailom na autorov daných štúdii a snažili sa zistiť ako rátali korelácie. Vyšlo najavo, že ide o nekorigované korelácie. Signifikantnosť aktivácie bola vyhodnocovaná v závislosti od korelácie. Signifikantne aktívne voxely nie sú tie s vysokou BOLD aktiváciou ale tie s vysokou koreláciou medzi aktiváciou a stupňom rozrušenia. Definovať aktiváciu takto nie je samo o sebe kontroverzné. Problematické je následné použitie aktívnych oblastí na vyhodnotenie sily efektu. Samozrejme ak prezrieme sto tisíc voxelov tak náhodne nájdeme aj nejaký, ktorý koreluje so stupňom rozrušenia s r>.8. Táto korelácia je náhodná a ťažko sa ju podarí replikovať. Obzvlášť problematické sú následné tvrdenia, že fMRI poskytuje spoľahlivý indikátor stupňa rozrušenia, depresívnosti, impulzívnosti… Riešením je buď korigovať veľkosť korelácie, zvoliť nezávislé kritérium pre hľadanie aktivovaných voxelov alebo použiť nezávislú vzorku probandov na validáciu veľkosti efektu.

5.3 Učenie strojov

Zaujímavou alternatívou ku klasickým štatistickým analýzam sú rôzne metódy učenia strojov (ML, Haynes & Rees, 2006). Pri týchto sa kladie väčší dôraz na schopnosť prediktívnosť ako na explanatívnu schopnosť metód. ML algoritmus si sám hľadá vzorce aktivity, ktoré najlepšie diagnostikujú správanie probanta. V nasledujúcom validačnom experimente možno pomocou aktivity predpovedať čo probant robí. Asi najznámejším príkladom sú štúdie Johna Haynesa zaoberajúce sa rozhodovaním. Soon et al. (2008) ukázali, že volne načasované rozhodnutia probantov možno identifikovať v niektorých prípadov až 8 sekúnd predtým, než si ich probanti uvedomia (než sa “rozhodnú”). Aj v týchto prípadoch podobne ako pri koreláciách je potrebná ďalšia vzorku probantov pomocou ktorej je výkon klasifikátora validovaný. Ak validácia prebehne na rovnakej vzorke na ktorej bol klasifikátor trénovaný, môže byť odhad jeho prediktívnosti nadhodnotený. ML je zaujímavou alternatívou v prípadoch kde je cieľom preukázať prediktívnosť neurónovej aktivity a konkrétny vzor aktivácie alebo jej lokalizácia nie sú až tak zaujímavé.

6. Klinická psychológia a fMRI

fMRI vzbudilo vlnu nevôle medzi klinickými psychológmi. Táto kritika je v mnohých aspektoch špecifická. Ako dva nedávne príklady možno citovať článok Gregoryho Millera (2010) alebo minuloročnú prednášku Dorothy Bishop. fMRI je súčasťou širšieho neurobiologického frontu, ktorý v klinických oblastiach odsáva finančné zdroje tradičnému behaviorálnemu výskumu. Neurobiologické metódy sľubujú lepšiu a spoľahlivejšiu diagnostiku a intervenciu. Tieto sľuby zostávajú z veľkej časti nenaplnené a odpútavajú pozornosť a zdroje od výskumu iných relevantných nebiologických faktorov. Zmeniť prostredie, správanie a rozhodnutia pacienta je pritom mnohokrát jednoduchšou a lacnejšou metódou ako zmeniť mozog než medikácia alebo neurotréning.

7. Mediálny ohlas

Prezentácia fMRI výskumu v médiách je kapitolou samou o sebe. Dôležité experimentálne, štatistické a inferenčné  detaily sú ignorované a fotky zo skenera sú prezentované ako okno do mysle človeka a vedú k povrchným článkom s uletenými tvrdeniami. Stručný výber: (Čo sa týka konkrétnej kritiky pozri Beck, 2010):

Chocoholics really do have chocolate on the brain.

Men see bikini-clad women as objects, psychologists say.

A neuroscientific look at speaking in tongues.

Neuron Network Goes Awry, and Brain Becomes an iPod.

This Is Your Brain on Politics.

Posledný menovaný článok bol op-ed v NY Times písaný vedcami, ktorí nerozhodnutým voličom ukazovali kandidátov do prezidentských volieb a pomocou skenera sa snažili vyčítať ich skryté preferencie. Na tento článok reagovalo listom 17 kognitívnych neurovedcov:

‘This Is Your Brain on Politics” (Op-Ed, Nov. 11) used the results of a brain imaging study to draw conclusions about the current state of the American electorate. The article claimed that it is possible to directly read the minds of potential voters by looking at their brain activity while they viewed presidential candidates.

[…]

As cognitive neuroscientists who use the same brain imaging technology, we know that it is not possible to definitively determine whether a person is anxious or feeling connected simply by looking at activity in a particular brain region. This is so because brain regions are typically engaged by many mental states, and thus a one-to-one mapping between a brain region and a mental state is not possible.

Samotná mediálna prezentácia mozgových skenov sa stala predmetom výskumu. Weisberg et al. (2008) dali probantom posúdiť správne a nesprávne (napr. kruhová argumentácia) vysvetlenia psychologických fenoménov. Niektoré vysvetlenia boli navyše okorenené neurovedeckým slovníkom. Probanti dokázali posúdiť správnosť, avšak neuroslovník signifikantne ovplyvnil ich hodnotenia, tak že neurovedecké vysvetlenia dostali v priemere vyššie hodnotenia správnosti. Autori pozorovali tento fenomén u laickej verejnosti a takisto u študentov neurovied. Skúsení výskumníci však boli voči neurovysvetleniam imúnni. V štúdii od McCabea a Castela (2008) študenti hodnotili logickosť novinových článkov. Články sa líšili len čo sa týka sprievodnej grafiky. Články doplnené skenmi mozgu dostali vyššie hodnotenie ako články s grafom výsledkov alebo bez grafiky.

Možný vysvetlením je že neurovysvetlenia sú jednoduché a pripomínajú redukcionizmus používaný vo fyzike alebo v chémii.  V prírodných vedách sú komplexné fenomény vysvetlené ako interakcia jednoduchých častí. Podobne články v novinách poskytujú dojem, že mozog sa skladá z funkčne odlišných oblastí a komplexné fenomény mysle vznikajú ich interakciou.

V reakcii na mnohé kontroverzie ohľadom skenovania mozgu a ich mediálnej prezentácie vyrástli viaceré blogy zaoberajúce sa kritikou neurovýskumu. Ako príklad poslúžia neuroskeptic, neurocritic, neurobonkers alebo mind hacks.

Rôzne kritiky fMRI výskumu v médiach zasa majú tendenciu vyeskalovať do pózy cisárových nových šiat – verejnosť bola vedcami zavádzaná až kým autor XY neukázal že ich štúdie sú nezmysli. Príkladom je reakcia na článok ohľadom Voodoo korelácii od Vul et al. (2009). Tento sa šíril internetom ešte pred tým než bol recenzovaný a publikovaný (pre zhrnutie histórie pozri Margulies, 2012). Po pár kolách na vedeckých blogoch sa dostalo voodoo koreláciám prezentácie na blogu Newsweeku. Autor blogu pohotovo vyniesol tvrdý rozsudok nad neurovedami: a “bombshell has fallen on dozens of such studies: according to a team of well-respected scientists, they amount to little more than voodoo science.” New Scientist, ktorý predtým radostne oslavoval neurovedy tiež skĺzol do hry na cisárove nové šaty.

Vul et al. menovali konkrétne štúdie, ktorých sa problémy týkali. Autori týchto štúdii tak boli nútený reagovať na tlačové správy. Dialo sa tak dosť chaoticky v diskusiách pod internetovými článkami. Publikované odpovede na odpovede s verziami rýchlo menili obsah takže bolo ťažké diskusie vôbec usledovať. Akademická diskusia nakoniec vyšla v PPS (Diener, 2009).

Z týchto príkladov vidieť, že prezentácia fMRI štúdii v médiach je do veľkej miery polarizovaná. Spôsobené je to z časti novosťou a komplexnosťou fMRI metodiky, z časti senzáciechtivosťou médii. Z časti došlo k prešľapom aj v podaní vedcov. Op-ed v NY times “This is Your Brain on Politics” bol písaní vedcami. Takisto Vul et al. mohli zvoliť trochu umiernenejší titul ako pôvodný Voodoo Corelations in Social Neuroscience. Voodoo korelácie vyznela ako alúzia na knihu Roberta Parka “Voodoo Science”, kritizujúcu pseudovedu. Článok bol nakoniec publikovaný pod iným titulom (Vul et al., 2009).

Trochu ironicky výsledky štúdii Weisberg et al. (2008), McCabea a Castela (2008) sa nepodarilo replikovať (Farah & Hook, 2013) a vplyv neuroslovníka a neuroobrázkov na kritické hodnotenie obsahu mediálnych článkov ostáva nejasný.

8. Dôležitosť psychologického teoretizovania pre fMRI

Čitatelia Mozgostrojov si už zvyknutí na moje frflanie nad nedostatkami psychologických teórii. Psychologické teórie tvoria hmlisté a simplistické príbehy o fungovaní mysle. Tieto jednoduché príbehy nie sú schopné popísať komplexnosť fenoménov ktoré sa snažia vysvetliť. Nie sú schopné poskytnúť detailné kvantitatívne predpovede a sú v konečnom dôsledku ťažko testovateľné a falzifikovateľné. Slabomocné teoretizovanie je zdrojom väčšiny problémov v psychológii a postihne aj ostatní výskum, ktorý prichádza s psychológiou do styku a ktorý sa musí na jej teoretickú produkciu spoľahnúť. Skenovanie mozgu je podľa mňa daľšou takouto obeťou. Ako bolo spomenuté v odsekoch o inferencii z fMRI dát, interpretovateľnosť závisí od dostupnosti testovateľných teórii. Lokalistické blobologické fMRI štúdie sú tak paralélnym produktom k telenovelám o schopnostiach, funkciách, oddieloch, moduloch a ich informačnej promiskuite. Myslím, že vývoj fMRI možno historicky prirovnať k vývoju mikroskopov. Ako prvé ľudia brali mikroskopy ako okno do mikrosveta. A čo nevideli? V súlade s esencialistickým myslením videli malých človiečikov v spermiách, malé kvety v semenách; mikrosvet bol tvorený malými liliputánmi a náš mezokozmos bol výsledkom ich konšpirácie. Podobne lokalistický výskum mozgu pomocou fMRI umožňuje uvidieť schopnosti a funkcie priamo v mozgu – ako malé entity, ktoré koordinujú naše myšlienkové pochody a naše správanie. Aplikácia mikroskopov vyrástla zo svojho protovedeckého použitia. Obrazy, ktoré poskytujú mikroskopy sú používané ako signál, na ktorého interpretáciu je potrebná štatistická analýza a značné teoretické znalosti. Dobrým príkladom je ďalšia technológia umožňujúca detailnejší pohľad – ďalekohľady a teleskopy. Astronómia by v určitom zmysle mohla byť modelom pre psychológiu a neurovedy. Na základe útržkovitých a (doslova) hmlistých dát sú astronómovia schopní vďaka šikovným štatistickým analýzam a solídnej teoretickej práci dospieť k záverom o fungovaní vesmíru.

Myslím, že najlepším riešením všetkých vyššie uvedených problémov fMRI výskumu je použitie kvantitatívneho psychologického a neurobiologického modelovania. Našťastie existujú vedci, ktorí sa týmto smerom už dnes uberajú. Exemplárne môžem odporučiť výskum Johna O’Dohertyho alebo Bradleyho Lovea. Čo sa týka širšej aplikácie tohoto prístupu som skeptický. Na jednej strane fMRI výskum je mladý a lokalistický výskum možno vnímať ako počiatočnú epizódu na ceste k vedeckej aplikácii skenerov. Svojim spôsobom je lokalizácia tou najjednoduchšou metódou ako skeny mozgu interpretovať a určite je potrebné ju vyskúšať. Keď už neumožňuje adekvátne teoretizovanie aspoň umožní deskriptívnu kategorizáciu poznatkov pre budúci výskum. Skôr než Darwin mohol prísť s evolučnou teóriou, boli potrebné  storočia tvorby herbárov, zbierania faktov o faune a flóre a hľadania správnej hierarchickej taxonómie. Myslím, že dnes už máme dostatočnú taxonómiu mozgových funkčných oblastí na to aby sa fMRI mohol posunúť do svojej vedeckej fázy. Hlavným problémom tak zostáva nedostatočná motivácia (podmienená nefunkčným systémom odmeňovania t.j. publikačným systémom) a nekompetentnosť psychológov čo sa týka modelovania. Predpovedám, že skenovanie mozgu bude pokračovať v hromadení nepresvedčivých a navzájom protirečiacich lokalistických výsledkov. Paralelnou alternatívou k tomu je zostup do výskumu podfunkcii a podpodfunkcii (napr. pamäť -> epizodická dlhodobá pamäť pre tváre). Ako sarkasticky vždy dodával Norbert Bischof, táto stratégia umožní vedcom dozvedieť stále viac o stále užšom fenoméne, až nakoniec vedia všetko o ničom.

Na záver chcem ešte zvážiť spätné implikácie fMRI dát pre matematické modelovanie v psychológii. Skenovanie mozgu býva občas prezentované ako protiklad k modelovaniu. Napríklad Tom Griffiths vo svojej prednáške chce skúmať ako vyzerajú ľudské reprezentácie. Svoju vedeckú metódu ilustruje preškrtnutým obrázkom skenera a Griffiths komentuje: “Rather than building special technology that we’re gonna use to answer these question, we are going to try to answer these questions using math.” (1:05-1:24). Ako si predstaviť toto tvrdenie? Ak Griffiths dostane dáta z fMRI štúdie tak fMRI merania vyhodí a postaví model výhradne na základe behaviorálnych dát? Griffiths zrejme kritizuje lokalistické štúdie fMRI. Je mylné myslieť si, že fMRI je možné použiť výlučne na lokalizáciu aktivácie. Práve naopak. Podľa mňa komplexnosť fMRI dát implikuje použitie matematických modelov. Takisto, komplexné modely je niekedy ťažké validovať a rozlíšiť pomocou behaviorálnych dát, keďže tieto neposkytujú dosť informácie. Inak povedané modely môžu byť moc komplexné z pohľadu behaviorálny dát. Samozrejme z pohľadu komplexnosti mozgu a kognície sú smiešnym zjednodušením. fMRI poskytuje dodatočný zdroj informácie pomocou ktorého možno tieto modely odlíšiť a testovať. Matematické modelovanie tak ide ruka v ruke s vývinom fMRI technológie a vskutku každej technológie, ktorá poskytuje dodatočné informácie o fungovaní mysle.

fMRI je obrovským pokrokom v tom zmysle, že poskytuje dodatočné informácie o fungovaní mozgu, ktoré so žiadnou súčasnou neurobehaviorálnou technológiou nedokážeme získať. Psychológovia ešte musia zistiť ako správne túto informáciu využiť aby sa dozvedeli niečo o fungovaní mysle.

Literatúra

Beck, D. M. (2010). The appeal of the brain in the popular press. Perspectives on Psychological Science, 5(6), 762-766.

Bennett, C. M., Miller, M. B., & Wolford, G. L. (2009). Neural correlates of interspecies perspective taking in the post-mortem Atlantic Salmon: An argument for multiple comparisons correction. NeuroImage, 47(1), 125.

Blumstein, S. E., & Amso, D. (2013). Dynamic functional organization of language: Insights from functional neuroimaging. Perspectives on Psychological Science, 8, 44–48.

Cardoso MM, Sirotin YB, Lima B, Glushenkova E, & Das A (2012). The neuroimaging signal is a linear sum of neurally distinct stimulus- and task-related components. Nature neuroscience, 15 (9), 1298-1306.

Diener, E. (2009). Editor’s introduction to Vul et al. (2009) and comments. Perspectives on Psychological Science, 4, 272.

Eisenberger, N. I., Lieberman, M. D., & Williams, K. D. (2003). Does rejection hurt? An fMRI study of social exclusion. Science, 302(5643), 290-292.

Farah, M. J., & Hook, C. J. (2013). The seductive allure of “seductive allure”. Perspectives on Psychological Science, 8(1), 88-90.

Fodor, J. (1983). The modularity of mind. Cambridge, MA: MIT Press.

Haynes, J.D., and Rees, G. (2006). Decoding mental states from brain activity in humans. Nat. Rev. Neurosci. 7, 523–534.

Margulies, D. S. (2011). Six Months of Methodological Controversy within Social Neuroscience. Critical Neuroscience: A Handbook of the Social and Cultural Contexts of Neuroscience, 273.

McCabe, D.P., & Castel, A.D. (2008). Seeing is believing: the effect of brain images on judgments of scientific reasoning. Cognition, 107, 343–352.

Miller, Gregory A. (2010). Mistreating psychology in the decades of the brain. Perspectives on Psychological Science, 5,716–743.

Milner, A. D., & Goodale, M. A. (1995). The visual brain in action. New York: Oxford.

Park, D. C., & McDonough, I. M. (2013). The Dynamic Aging Mind Revelations From Functional Neuroimaging Research. Perspectives on Psychological Science, 8(1), 62-67.

Poldrack, R. A. (2006). Can cognitive processes be inferred from neuroimaging data?. Trends in cognitive sciences, 10(2), 59-63.

Poldrack, R. A. (2010). Mapping mental function to brain structure: how can cognitive neuroimaging succeed?. Perspectives on Psychological Science, 5(6), 753-761.

Soon, C. S., Brass, M., Heinze, H. J., & Haynes, J. D. (2008). Unconscious determinants of free decisions in the human brain. Nature neuroscience, 11(5), 543-545.

Wager, T. D., & Atlas, L. Y. (2013). How Is Pain Influenced by Cognition?
Neuroimaging Weighs In. Perspectives on Psychological Science, 8, 91–97.

Van Horn J. D., and Gazzaniga M. S. (2012). Why share data? Lessons learned from the fMRIDC. NeuroImage.

Vul, E., Harris, C., Winkielman, P., & Pashler, H. (2009). Puzzlingly high correlations in fMRI studies of emotion, personality, and social cognition. Perspectives on Psychological Science, 4(3), 274-290.

Weisberg, D.S., Keil, F.C., Goodstein, J., Rawson, E., & Gray, J.R. (2008). The seductive allure of neuroscience explanations. Journal of Cognitive Neuroscience, 20, 470–477.

Povedú výkonnejšie počítače k vývoju chytrých robotov?

Moorov zákon hovorí, že počet obvodov na čipe a teda výkon počítačov sa zdvojnásobí približne každé dva roky. Nižšie prikladám grafiku z Wikipédie ktorá znázorňuje evolúciu procesorov (počet elektrických obvodov na čipe) a takisto evolúciu kapacity pevných diskov. Mierka ypsilónovej osy je logaritmická a teda lineárny súvis vyjadruje exponenciálny rast.

Pre bežného uživatela od určitého momentu prestal byť tento vývoj taký vzrušujúci. Ja napríklad nevyužijem viac ako 50 gigabajtov pevného disku. Podobne, vyššia výkonnosť procesora napríklad reakčné časy internetového prehliadača nevylepší, keďže tieto sú prakticky nulové. (Výrobcovia hardwaru preto vytvorili s výrobcovami softvéru niečo ako kartel. Softvérové firmy vyrábajú exponenciálne pomalší softvér, napr. OS Microsoftu, ktorý núti užívateľov kupovať exponenciálne rýchlejšie procesory. )
Pre vedcov je však tento vývoj dôležitý. Modely na ktorých výpočet ste pred desiatimi rokmi potrebovali univerzitné výpočtové centrum môžete dnes simulovať doma na laptope. Bayesiánska štatistika sa stala do veľkej miery vôbec aplikovateľnou vďaka nárastu výpočtovej kapacity. Ak si prelistujete 15 rokov starú učebnicu bayesiánskych analýz nájdete v nej návody ako analyticky zjednodušiť vyhodnotiť modely a aj to len pre zopár prípadov pohodlného gausovského rozdelenia. Dnes by tieto modely nikoho nenapadlo zjednodušovať a analyticky vyhodnocovať. Simulácie modelov pomocou MCMC metód sú jednoduché, rýchle a zanedbateľne presné a môžete ich aplikovať bez problémov na negausovské prípady.

Od exponenciálneho rastu výpočtovej kapacity si viacerí výskumníci učenia strojov a umelej inteligencie sľubujú inteligentnejšie stroje. Výpočtová kapacita systémov, ktoré nájdete momentálne popísané v publikovanom výskume je primitívne jednoduchá oproti výpočtovej kapacite ľudského mozgu. Je tomu jednoducho pre to, že dostupné počítače nie sú dostatočne výkonné, aby umožnili simulácie komplexnejších modelov. To sa však časom zmení a ak sa Moorov zákon potvrdí aj do budúcnosti môžeme mať za 20 rokov počítače s výkonom ľudského mozgu. Vedci ako Jürgen Schmidhuber očakávajú, že vyvoju umelej inteligencie nestojí nič v ceste a dostaví sa automaticky. Kritici namietajú, že je naivné si myslieť, že stačí posunúť súčasné primitívne modely do ríše ziliónbajtov a zrazu z nich vyskočí niečo inteligentné. Stačí si spomenúť napríklad na Deep Blue, ktorý dokázal hrať šach vďaka vysokej výpočtovej kapacite avšak inak bol dosť sprostý. V konečnom dôsledku však až budúcnosť ukáže nakoľko je vyššia výpočtová kapicita kľúčom k umelej inteligencii. Najpravdepodobnejší scenár je, že  aplikácia súčasných modelov vo väčšej mierke nebude dostatočná. Avšak táto aplikácia umožní identifikovať ich limity a nové problémy. Nové problémy zasa povedú k vývoju lepších modelov.

Medzičasom sa samozrejme môžeme pozrieť na občasné výskumné expedície na hranice výpočtovej techniky. Naposledy zveril minulý rok Google Profesorovi Ng zo Stanfordovej Univerzity klúče od miešačky. Ng s kolegami (Le et al., 2012) postavili obrovskú neurónovú sieť pozostávajúcu z deviatich vrstiev s približne miliardou spojení (synáps). Tento kybermozog rozbehli po dobu troch dní na 16 tisíc (!!!) jadrách v labákoch Googlu v Kalifornií. Neurónovú sieť kŕmili 200×200 pixlovými obrázkami z internetu. Tréningovú vzorku tvorilo 10 miliónov obrázkov, ktoré autori získali ako snapshoty z videi na youtube.

Tréning prebiehal trochu inak ako u typických neurónových sietí. Vedci nepovedali neurónovej sieti čo sa má naučiť, ale trénovali ju, aby dokázala zrekonštruovať svoje vstupy – teda obrázky. Inak povedané neurónová sieť bola trénovaná aby výstupné neuróny na konci vypľuli rovnaký obrázok, ktorý enkódujú vstupné neuróny. Táto úloha nevyzerá moc zaujímavo. Úloha začne byť zaujímavá až keď určíme, že počet neurónov v skrytých vrstvách je menší ako počet vstupný/výstupných neurónov. To znamená, že systém musí redukovať a komprimovať vstupný obrázok tak aby stratil čo najmenej obsiahnutej informácie – aby ho dokázali na výstupe znova rekonštruovať. Keďže vzorka obrázkov je omnoho väčšia ako počet skrytých neurónov, neurónová sieť sa zároveň musí naučiť extrahovať informáciu ktorá umožní obrázky optimálne kategorizovať. Získaná komprimovaná informácia musí v konečnom popísať celú vzorku obrázkov.

Týmto systémom sa hovorí auto-asociatívne neurónové siete a sú dávno známe. V podstate sa jedná o regulárne neurónové siete, ktoré možno rovnako trénovať pomocou backpropagation akurát sú výstupy v tréningovej vzorke identické s vstupmi a počet skrytých neurónov je nižší ako počet vstupných/výstupných neurónov. Ng s kolegami prebrali tento jednoduchý koncept a aplikovali ho v merítku 16 tisíc jadier, ktoré zrejme len tak ležia a nemajú čo robiť v sídle Googlu. Môžeme si skúsiť predstaviť 16 tisíc jadier. Laptop na ktorom tento príspevok píšem má procesor s dvoma jadrami. Na našom psychologickom inštitúte sú dve počítačové miestnosti (určené pre študentov) s ca. 30 počítačmi pospájaními v jednej sieti. Ak by som chcel túto sieť využiť mám k dispozícii ca. 60 jadier. K náročnejším výpočtom stojí univerzitným pracovníkom k dispozícii BW grid, počítačový cluster združujúci počítačové centrá na univerzitách v bádensku-würtembersku. BW grid poskytuje z 2800 jadier. Najrýchlejším výpočtovým centrom v Európe je SuperMUC v Leibnitz Rechenzentrum v Garchingu pri Mníchove. SuperMUC ponúka 160 tisíc jadier.

Treba dodať, že výstavba a prevádzka takýchto výpočtových centier so superpočítačmi je nákladná a výber a prevedenie projektov podlieha prísnym kritériám. Prednosť majú samozrejme projekty, ktoré sú relevantné pre národnú bezpečnosť – simulácie zemetrasení a cunami vĺn v Japonsku alebo simulácie dráh balistických a jadrových rakiet v USA. V dôležitosti nasleduje vyhodnocovanie astronomických dát, simulácie buniek, baktérii, vírusov a iných biochemických systémov. Neurónová sieť s miliardou spojení patrí do kategórie algoritmických hračiek, ktorých praktická relevancia je nízka. Zrejme však nie pre Google.

Identifikácia objektov – napríklad tvári, osôb na obrázkoch a vo videách je v súčasnosti stále ťažký problém. Obrázky objektov podliehajú obrovskej variabilite. Napr. osvetlenie, uhol pohľadu, tvar objektu sťažuje identifikáciu. Pre Google je však tento problém zjavne zaujímavý. Robustný algoritmus by dokázal vyhľadávať obsah nielen v popiskoch videa, ale aj na základe obsahu samotného videa/obrázku. Ngeho s kolegami zaujímalo, či neurónová sieť dokáže bez explicitných inštrukcii extrahovať z obrázkov nejaké zaujímavé objekty. Na to zobrali vzorku obrázkov tvárí a iných objektov a pohľadali neurón v celej sieti, ktorý je najúspešnejší pri identifikácii týchto tvárí. Výkon tohoto neurónu následne otestovali na nezávislej vzorke obrázkov. Najlepší neurón bol úspešný v identifikácii tvárí. Autori následne našli stimulus pre ktorý daný neurón produkuje najsilnejšiu reakciu. To nám umožní do určitej miery zistiť sémantiku daného neurónu. Nižšie je znázornený výsledný obrázok.

Daný neurón vskutku enkódoval archetypálnu tvár.Podobný experiment spravili pre kategóriu mačky a tela osoby.

Tieto výsledky sú povzbudivé avšak úspešnosť algoritmov možno posúdiť až v porovnaní s inými state-of-art riešeniami. K tomuto účelu existujú určité benchmarkové databázy, ktorých cieľom je umožniť porovnanie výkonnosti algoritmov naprieč publikáciami. Ak chcete publikovať výskum musíte ukázať, že algoritmus aj prakticky je úspešný. Algoritmus musíte vyhodnotiť na takejto databáze obrázkov a porovnať jeho výkon s výkonom iných algoritmov v predchádzajúcich publikáciach. Jednou takou databázou je ImageNet. ImageNet obsahuje 14 miliónov obrázkov s 20000 kategóriami objektov. Tieto databázy poskytujú tréningovú vzorku, v ktorej sú objekty pomenované a testovaciu vzorku, kde identitu objektu musí určiť algoritmus. Ng s kolegami dodatočne použili tréningovú vzorku aby doladili neurónovú sieť. Test ukázal úspešnosť identifikácie ca. 15 % čo je obrovský pokrok oproti predchádzajúcemu najlepšiemu výkonu na úrovni 9 %.

Myslím, že zaujímavé je, že spomenutá neurónová sieť sa naučila rozpoznávať tváre bez toho aby dostala feedback alebo vôbec informáciu že nejaké tváre existujú. Za zmienku takisto stojí, že autori štrukturovali architektúru siete po vzore ľudského vizuálneho areálu a táto štruktúra sa ukázala úspešnejšia ako iné štruktúry navrhnuté a rutinne používané v literatúre. (Tieto architektúry testovali v separátnych trojdňových výpočtových orgiách.) Pre psychológiu to znamená napr. že vývin vnímania tvári nemusí byť nijak geneticky preprogramovaný a neurónové detektory na tvár ktoré sa našli v mozgu nemusia byť modulárne izolované. Experiment s neurónovou sieťou ukazuje alternatívne možnosti ako tieto detektory vznikajú bez akéhokoľvek feedbacku z prostredia. Zároveň treba dodať, že výkon 15 % je stále mizerný na to aby sme mohli začať neurónovú sieť prakticky využiť na čítanie obsahu obrázkov a videa.

Nakoniec, čo sa týka nárastu výpočtových zdrojov, Ngeho štúdia ukazuje, že môžeme byť optimistický. Podobný čerstvý prípad aplikácie hlbokých neurónových sietí v ríši ziliónbajtov tvoria prekladateľské aplikácie, ktorých praktické využitie už nemusí byť ďaleko.

Le, V., Q. et al. (2012). Building High-level Features Using Large Scale Unsupervised Learning.