Záhada chýbajúceho štvorca

Nasledujúci problém by mal byť čitateľom intímne známy.

Práve prechádzam Knuthovu Concrete Mathematics, kde som zistil, že vyššie uvedený trik má aj zaujímavé pozadie. To pozadie tvoria Fibbonaciho čísla.

Tieto sú dané rekurziou

F_n = F_{n-1}+F_{n-2}

F_0 = 0, F_1=1

Takto získame postupnosť čísel 0,1,1,2,3,5,8,13,21,34,55,89,144… S Fibonacciho číslami možno zažiť kopec srandy a dopracovať sa k zaujímavým výsledkom. Nás zaujíma Cassiniho rovnosť:

F_{n+1}  F_{n-1}= F_n^2 +(-1)^n

ktorú možno dokázať pomocou indukcie. Túto rovnosť možno interpretovať nasledovne. Ak máme štvorec s obsahom F_n \times F_n  štvorčekov tak k nemu existuje obdĺžnik s rozmermi F_{n+1} \times F_{n-1}, ktorého obsah je o jeden štvorček menší/väčší, v závislosti od toho či je n párne alebo nepárne. Ľavý štvorec môžeme rozdeliť na dva štvoruholníky a dva trojuholníky, ktorých body majú vzdialenosť k hrane štvorca F_{n+1},F_{n}, F_{n-1} alebo F_{n-2}. Na prvý pohľad to vyzerá tak, že rovnako môžeme rozdeliť aj pravý štvorec.

Zdanie však klame. Všetky časti vpravo sú štvoruholníky (inak dĺžka čiar nesedí). Ak zvolíme tenšiu čiaru alebo menšie Fibonacciho číslo tak časti z ľavého štvorca do ľavého obdĺžnika nenapcháme.


Podobne funguje aj záhada chýbajúceho štvorca. Ak zmeriame rozmery trojuholníkov a ich častí, aj tu nájdeme zopár Fibonacciho čísiel. Problém však nemožno zovšeobecniť a vytvoriť ďalšie príklady pre vyššie Fibonacciho čísla. Ak je dlhšia vertikálna strana zelenej časti a, kratšia je b a dlhšiu a kratšiu stranu žltej časti označíme c a d. Tak vpravo musí platiť a=c a vľavo a+b=c+d a teda b=d. Zároveň však chceme aby b+d=a=c a  aby buď b alebo d bolo rovné 1 a teda musí platiť b=d=1 a c=a=2. Jediné riešenie, ktoré spĺňa podmienky je na začiatku uvedený problém.

Pripájam ešte program pre Python, ktorý vám umožní vygenerovať štvorce a obdĺžniky.

import numpy as np
import pylab as plt

def fibo(n): return int(((1 + 5**0.5)/2)**n/5**0.5+0.5)
s=4;e=9
for N in range(s,e):
    f0=fibo(N-2)
    f1=fibo(N-1)
    f2=fibo(N)
    f3=fibo(N+1)
    lw=2
    plt.figure(0)
    plt.subplot(e-s,2,(N-s)*2+1)
    plt.xlim([0,f2])
    plt.ylim([0,f2])
    ax=plt.gca()
    ax.set_xticks(range(f2))
    ax.set_xticklabels([])
    ax.set_yticks(range(f2))
    ax.set_yticklabels([])
    ax.set_aspect(1)
    plt.grid(linestyle='-')

    plt.plot([0,f1],[f1,f0],'k',lw=lw)
    plt.plot([f1,f1],[0,f2],'k',lw=lw)
    plt.plot([f1,f2],[0,f2],'k',lw=lw)

    plt.subplot(e-s,2,(N-s+1)*2)
    plt.xlim([0,f3])
    plt.ylim([0,f1])
    ax=plt.gca()
    ax.set_xticks(range(f3))
    ax.set_xticklabels([])
    ax.set_yticks(range(f1))
    ax.set_yticklabels([])
    ax.set_aspect(1)
    plt.grid(linestyle='-')

    plt.plot([0,f3],[f1,0],'k',lw=lw)
    plt.plot([f1,f1],[0,f0],'k',lw=lw)
    plt.plot([f2,f2],[f1,f1-f0],'k',lw=lw)
plt.show()

Reklamy

Karmiloff-Smith: Beyond Modularity

Po dlhom čase sa znovu dostávam k vývinovej psychológii. V poslednom príspevku k tejto téme som predstavil hlavné teoretické prúdy. V nasledujúcich príspevkoch predstavím zopár zaujímavých monografii z vývinovej psychológie. Ako prvú som vybral knižku od Annette Karmiloff-Smith (AKS), ktorá vyšla pred viac než dvadsiatimi rokmi. Jej kniha je podľa mňa prvá post-piagetiánska kniha snažiaca sa o ucelený pohľad na ľudský vývin. Kniha sa pokúša o posun oproti neplodnej nature-nurture debate ktorá prebiehala v 70. a 80. rokoch medzi Piagem a Fodorom/Chomskym. AKS bola dlhé roky žiačkou a spolupracovníčkou Piageho na Ženevskej univerzite. S nástupom habituačných štúdii vo výskume kojencov a nimi získanej evidencie sa však jej pohľad výrazne odklonil od Piageho konštruktivizmu. Na druhej strane však neakceptovala nativistické predstavy Fodora a Chomského. Ako som už písal títo v podstate popierajú existenciu vývinu. Moduly sú buď prítomné od narodenia alebo sú naštartované maturáciou (podobne ako pohlavné zmeny v puberte). Ak sa niečo vyvíja, tak sú to len centrálnymi procesmi získané vedomosti. AKS nesúhlasí s Fodorovým striktným delením na vstupné systémy (moduly) a centrálne procesy. AKS odmieta existenciu predprogramovaných modulov a že by ich výstupy mali spoločný formát (Fodorov Jazyk mysle). Túto pozíciu odráža aj titul knihy. Ako som však spomenul AKS sa rozchádza aj s Piagem a jej kniha by sa kľudne mohla volať aj Beyond Constructivism. AKS prijíma (tak ako nativisti), že vývin je doménovo špecifický. To znamená, že vývin prechádza asynchrónnymi trajektóriami v rozličných doménach (jazyk, vedomosti ohľadom fyziky alebo psychológie) a teda, že niečo ako Piageho vývinové etapy neexistuje. To však ešte neznamená, že vývin v rôznych doménach je nezávislý alebo že by nemal spoločné črty. AKS nahrádza Piageho etapový model svojím fázovým modelom. Podľa tohoto rôyzne domény (a mikrodomény v rámci týchto) prechádzajú rovnakými fázami. AKS volá tento fázový proces reprezentačný prepis (Representational redescription, RR). Proces pozostáva z troch fáz. V prvej fáze sa dieťa spolieha na input z okolia, ktorý mu umožní vyriešiť problém ktorému čelí. V tejto fáze môže byť dokonca správanie dieťaťa podobné tomu u dospelého, ale formát reprezentácie umožňujúci správanie je odlišný. Deti sa s riešením neuspokoja. V druhej fáze zmenia formát reprezentácie. Táto zmena je vnútorne motivovaná. Deti konsolidujú svoje vedomosti čo môže viesť k dočasnému zanedbaniu indícii získaných z okolia, dôležitých pre riešenie problému a v konečnom dôsledku k zhoršeniu riešenia úlohy. Až v tretej fáze sa deti dostanú naspäť na úroveň riešenia z prvej fázy. Ich reprezentácie problému sú však iné a umožňujú flexibilnejšie správanie.

RR proces umožňuje deťom preklenúť priepasť medzi odlišnými formátmi reprezentácii. AKS rozlišuje štyri formáty/úrovne reprezentácie. Na prvej úrovni (I) sú reprezentácie implicitné a doménovo špecifické. Reprezentácia na druhej úrovni (E1) umožňuje zovšeobecňovanie vedomosti a ich použitie v rámci iných domén. Vedomosti sa postupne stávajú stále viac explicitnými. Reprezentácie na tretej úrovni (E2) sú prístupné vedomej reflexii a vedomosti reprezentované na štvrtej úrovni (E3) dokážu deti verbálne sformulovať. (Tretiu a štvrtú úroveň AKS často spája dokopy do E2/3, keďže tieto úrovne v mnohých prípadoch nie je možné empiricky odlíšiť.) Tento proces nepopisuje len vývin ale proces učenia všeobecne. AKS to ilustruje na príklade učenia sa hrania na klavír. Na začiatku sa žiak snaží získať procedurálne schopnosti – dostať do rúk postupnosť tónov a následnosť melódii. Tieto vedomosti sú automatické a implicitné (I). Postupným ďalším tréningom sa jeho hranie stáva flexibilnejším. Dokáže zrýchliť spomaliť alebo zmeniť dynamiku (E1). Nakoniec žiak sa naučí improvizovať. Dokáže obmieňať melódie a hrať variácie na danú tému (E2/3).  AKS pripúšťa že vstupy a výstupy pre rôzne formáty nemusia nasledovať postupnosť (ako v prípade hrania na klavír), ale napríklad, E1, E2 aj E3 môžu byť odvodené z I alebo E1 a E2 odvodené z I a E3 odvodené z E1. Takisto viaceré formáty môžu existovať paralelne a nájsť svoju aplikáciu v rôznych kontextoch.

Štruktúra knihy reflektuje doménovú špecifickosť vývinu. Rôzne kapitoly sú venované rozličným doménam. Ako ukážku priblížim druhú kapitolu, ktorá je venovaná vývinu jazyku. AKS ukazuje, že evidencia stojí v rozpore s Piageho pohľadom na vývin jazyka. Podľa Piageho je jazyk odvodený z gest a senzomotorických vzorov. Napríklad pochopenie konceptu nádoby (ako objektu ktorý môže obsahovať iný objekt) je dôležitým predpokladom pre pochopenie členenia viet. AKS spomína výskum s hluchonemými deťmi. Tieto vskutku najprv používajú gestá pre komunikáciu, napríklad pre Ja ukážu na seba a pre Ty ukážu od seba. Problém je v tom že vo fáze nástupu jazykových schopností počas druhého roku, deti začnú používať ukazovanie symbolicky a nesprávne. Ukazovanie od seba používajú pre označenie seba pretože videli, že tento znak takto používajú iný keď referujú o nich. Takéto použitie je nesprávne z hľadiska gest ale aj z hľadiska posunkovej reči. (K tomuto omylu však dochádza bežne aj u hovoriacich deti, ktoré v určitej fáze označujú seba ako “ty” a napríklad svoju mamu ako “ja”.) V neskoršom veku deti zistia ako správne zámená používať. Tento výskum ukazuje, že jazyk nie je jednoduchým rozšírením gestikulácie ako si Piaget predstavoval. Príklad zároveň ilustruje RR proces a jeho prechod fázou suboptimálneho správania.

AKS ilustruje implicitné jazykové schopnosti detí. Napríklad jeden a pol roční kojenci dokážu rozlíšiť vety obsahujúce tranzitívne a intranzitívne vetné štruktúry. (Deti sú prekvapené ak A robí niečo B a pritom hlas hovorí, že B robí niečo.) Dvojročné detí dokážu posúdiť správne použitie kauzatívnych slovies a takisto spojky “s”, dlho predtým než tieto slová sami začnú používať.

Implicitné semantícké a syntaktické znalosti usmerňujú pozornosť detí na aspekty reči, ktoré im napomôžu k nadobudnutiu exlicitných vedomostí. Tieto vedomosti sa však ďalej vyvíjajú. Napríklad 4/5 ročné deti používajú správne určitý člen a zámeno (“the” a “my”) v závislosti od kontextu reči avšak až ako 10 ročné dokážu vysvetliť prečo je použitie zámena v danom kontexte správne. AKS podáva ďalšie ilustrácie RR modelu na príkladoch vývinu konceptu slova, používania určitých a neurčitých členov. Jej posledný príklad sa týka štruktúry rozprávania. Napríklad zámená ako ona alebo on nie sú používané často a ak áno tak prevažne na označenie hlavného aktéra/aktérky.V ostatných prípadoch je daná osoba referovaná menom alebo vedlajšou vetou. Sedem ročné deti dokážu správne vybrať zámená (E1) avšak ani mnohí dospelí nedokážu vysvetliť dôvody ich voľby (E2/E3). RR je teda proces, ktorý nemusí byť v rámci vývinu vôbec skončený.

Zhrnutie nasledujúcich kapitol si odpustím. Tieto nasledujú štruktúru druhej kapitoly – najprv AKS predstaví Piageho pozíciu, potom príde na rad novší nativistický výskum. Tento sa zaoberá skorými implicitnými vedomosťami. AKS následne ukazuje ako v každej doméne dochádza k vývinu explicitných reprezentácii a ako RR model tento vývin dokáže popísať.

Každá kapitola predstavuje inú domény. Tretia kapitola je venovaná vývinu znalostí fyzikálneho sveta (vlastnosti objektov, gravitácia, pohyb). Štvrtá kapitoly sa zaoberá vývinom konceptu čísla. V piatej kapitole sa dozvieme o sociálnych schopnostiach a znalostiach u detí. Nakoniec šiesta kapitola sa zaoberá vývinom písania a kreslenia.

V predposlednej kapitole AKS znova diskutuje nativizmus a Piageho konštruktivizmus. Podľa AKS je jadrom Piageho teórie jeho epistomológia zdôrazňujúca dynamický a epigenetický charakter detského vývinu a nie jeho etapový model. Podľa AKS, teda odvrhnutie etapového modelu nie je rozlúčkou s Piageho názormi, ale svoj RR model vníma ako dôsledok aplikácie Piageho epistemológie a teda ako pokračovanie a rozvoj Piageho myšlienkového dedičstva. AKS sa však odkľáňa aj od záverov nativistických autorov (Spelke, Gelman, Leslie), ktorých štúdie pred tým použila pri argumentácii proti Piageho názorom. Konkrétne poznamenáva že skoré schopnosti modulárneho charakteru môžu byť produktom epigenézy, kde učenie a skúsenosť hrá dôležitú rolu. To, že výsledné schopnosti vykazujú znaky modularity AKS neodrádza. V tomto prípade hovorí AKS o modularizácii – o procese keď sa  doménovo všeobecné, senzomotoricky naučené schopnosti postupne stanú automatickými, rigídnymi a doménovo špecifickými. (Modularizácia zodpovedá prvej časti učenia hrania na klavír, keď sa žiak snaží získať procedurálne schopnosti.) AKS sa odvoláva na evidenciu o plasticite mozgu, ktorá podľa nej spochybňuje existenciu vrodených modulov a la Fodor aj keď ďalší výskum je potrebný. Vrodené faktory ak aj existujú nebudú mať podľa AKS formu vedomostí alebo schopností. Stačí, aby bola pozornosť kojenca správne nasmerovaná na to aby sa RR proces evolúcie schopností a vedomostí odlepil od zeme. Ak je podľa AKS niečo vrodené tak sú to biasy v pozornosti alebo v motivácii kojenca. Pod epigenetických vývinom AKS rozumie práve interakciu týchto vrodených biasov s informáciami poskytnútími prostredím, čo vedie k procesu učenia a získavania vedomostí a schopností.

Záver knihy sa dá premrhať – napríklad tak ako to spravil Tony Chemero, keď venoval posledné dve kapitoly filozofovaniu o vedomí, alebo je možné na záver ešte posledný krát zapnúť na plný plyn. Tak spravila AKS keď poslednú kapitolu venovala formálnemu modelovaniu. Podľa AKS je znalosť detského vývinu dôležitá pre teoretizovanie v kognitívnych vedách a tak sa snažila napísať knihu, ktorá by zaujala aj kognitívnych vedcov. Keďže títo majú okrem iného záľubu v matematickom modelovaní pridala AKS aj kapitolu o modelovaní. AKS sa zaoberá konekcionizmom, pod ktorý radí neurónové siete a dynamické systémy a ktorý ma najbližšie k jej predstavám o vývine. Neurónové siete podľa AKS dobre popisujú nadobúdanie implicitných vedomostí a aj proces modularizácie. AKS však chýba formalizácia jej RR procesu. AKS vidí dve výzvy pre konekcionistov ak chcú formalizovať RR proces. Po prvé, E1 formát prípúšťa výmenu informácii v rámci domén a mikrodomén. Problém je v tom, že konekcionistické modely sa zaoberajú výlučne učením jednej konkrétnej úlohy, zvládnutím konkrétneho problému. Pre modelovanie RR procesu je potrebný systém ktorý sa učí a vyvíja paralelne (avšak nie nutne synchrónne) vo viacerých doménach. Riešením môže byť hierarchická interakcia viacerých neurónových sieti, každá slúžiaca určitej doméne. Druhým problémom je, že či a ako dokážu neurónové siete uložiť explicitný symbolický obsah. Možným riešením je kombinácia konekcionistických a symbolických techník do hybridnej architektúry.

Na záver, v epilógu sa AKS zamýšla nad tým, že RR proces je unikátnou kognitívnou schopnosťou ľudí: “The RR model is fundamentally a hypothesis about the specifically human capacity to enrich itself from within, by exploiting knowledge already stored, not by just exploiting the environment.” (Karmiloff-Smith, 1992, s. 192)

Poukazuje na to, že pokusy naučiť opice jazyk zostali viaznúť na neschopnosti opíc dosiahnuť viac než implicitnú reprezentáciu gramatiky.

Z reakcii som našiel diskusie k článku Clarka a AKS (1993) v Mind and Language a diskusiu k Precis v BBS (Karmiloff-Smith, 1994). Filozofi sa vybúrili v Mind & Language a tak som mohol s kľudom siahnúť po diskusii v BBS aj keď nejaké filozofické diskusie skĺzli aj sem. Tieto sa väčšinou točili okolo problémov ako možno reprezentácie prepísať do spoločného explicitného jazyka, koľko takýchto jazykov treba a či by predsalen nebolo úspornejšie ostať pri stáde modulov a jednom reprezentačnom jazyku (Fodorov Jazyk mysle). Našťastie sa ozvali aj nejakí inžinieri a informatici. V podstate už začiatkom 90. rokov existovali modely funkčne podobné RR modelu. Tom Schulz spomenul svoje pokusy modelovať vývinové dáta s neuronovými sieťami, ktoré menia (rastú) svoju architektúru počas učenia. Rick Grush zasa spomenul koncepty z teórie riadenia: emulátor a riadiaci okruh (controller). Emulátor umožňuje simulovať javy na základe správania, zatiaľčo riadiaci okruh určí na základe pozorovaných javov optimálne správanie. K vnútornej zmene reprezentácie analogickému k RR procesu môže dojsť v systéme, ktorý obsahuje emulátor a takisto riadiaci okruh. Takýto systém simuluje dianie vo svete a ná zaklade výsledkov simulácii prispôsobí správanie. Takto môže sa môže systém učiť bez akýchkoľvek nových dát. Dnes nájdeme zodpovedajúce algoritmy v oblasti spätnoväzbového učenia (RL, reinforcement learning) pod hlavičkou Model-based RL. S podobnými predstavami prišiel aj Aaron Sloman. Sloman rozoberá knihu v tomto článku.

Celkovo je však autorke knihy ťažko vyhovieť a to nielen v hladaní počítačových implementácii RR ale aj pri hľadaní podporujúcej alebo protichodnej evidencie. Ako s väčšinou teoretizovania v psychológii je návrh AKS moc hmlistý aby mohol byť empiricky prešetrení. Akú konkrétnu hypotézu napríklad RR model poskytuje? Zvládnuté implicitné učenie je dôležitou podmienkou pre RR proces a pre vznik explicitných reprezentácii. Je to však dostatočná podmienka? Nie, AKS sama tvrdí, že v niektorých prípadoch k RR procesu vôbec nemusí dojsť a reprezentácie nedosiahnu plne explicitnú úroveň (viď. vyššie spomínaný príklad vedomostí štruktúry rozprávania). Je to nutná podmienka? Ďalší prispievatelia v diskusii poukázali na príklady, kde k RR procesu dochádza v prípadoch kde implicitné učenie nie je plne zvládnuté. Takisto boli zdokumentované interakcie, kde sa samotná implicitná reprezentácia mení v priebehu prepisu do explicitnej formy (teda v priebehu RR procesu). Samozrejme RR model možno rozšíriť tak, aby obsahoval všetky tieto prípady. Model sa však stane tým bezobsažný a nezaujímavý. AKS sa bráni, že jej návrh bol myslený ako teoretický rámec, ktorého detaily doplnia ostatní výskumníci. V tomto ohľade sa aj cíti sklamaná diskusiou v BBS. Takýto prístup mi pripadá nepoctivý. Novú Matúšovu teóriu všetkého, ktorej detaily doplnia fyzici som schopný dodať každý deň v týždni. Prístup AKS je ale charakteristický pre úroveň teoretizovania v psychológii. Diskusie (napr. v BBS) pripomínajú bublajúci kotol kde vedci po sebe háďžu a odrážajú naspäť názory v nádeji, že po vzore hry telefón vznikne niečo teoreticky prevratné. Takýto akademický kabaret je určite príjemnejší ako tá správna alternatíva – sadnúť si a pokúsiť sa formalizovať problém a jeho potenciálne riešenie.

Clark, A., & Karmiloff-Smith, A. (1993). The cognizer’s innards: a psychological and philosophical perspective on the development of thought. Mind & Language, 8(4), 487-519.

Karmiloff-Smith, A. (1994). Precis of beyond modularity: A developmental perspective on cognitive science. Behavioral and Brain Sciences, 17(4), 693-706.

Karmiloff-Smith, A. (1992). Beyond Modularity: A Developmental Perspective on Cognitive Science. MIT press.

Entropia a Pravdepodobnosť

Posledné dve dekády boli poznamenané vzostupom bayesiánskych probabilistických metód. Tento poznačil v podstate všetky oblasti skúmania od štastiky a učenia strojov až po aplikované oblasti ako bioinformatika, ekonometria alebo práve modelovanie v kognitívnych vedách. Okrem vzrušujúcich aplikácii umožnila probabilistiká formulácia zovšeobecniť a zjednotiť rôzne algoritmy.  V 90. rokoch tak výskumníci so vzrušením zistili, že rozličné modely – lineárnu regresiu, logistickú regresiu, markovské siete alebo analýzu hlavných komponent možno sformulovať ako bayesiánske grafické modely. To sa odrazilo aj na nástupe učebníc, ktoré prevzali bayesiánsky prístup ako zjednucujúci princíp, z ktorého možno všetky aplikácie podľa potreby odvodiť. V učení strojov sem patrí napríklad Bishofova PRML alebo najnovšie Barberova BRML.

Zaujímavé je pritom, že ku všeobecnej probabilistickej formulácii existuje na prvý pohľad paralelná formulácia, ktorá narába s entropiou ako kvantitou vyjadrujúcou stupeň neistoty – teda vlastne tú istú vec čo pravdepodobnosť. Tejto formulácii sa dostalo málo pozornosti. Edwin Jaynes bol historicky najväčším propagátorom entropickej interpretácie. Jaynes si pritom sľuboval od tejto interpretácie, že vyrieši chronický problém bayesiánov s určením objektívnych apriori pravdepodobností pre bayesiánske modely. V tomto článku chcem rozobrať Jaynesov prínos v tejto oblasti, ktorému sa venuje v 11. a 12. kapitole svojej knihy Probability Theory (Jaynes, 2003). V ďalšom príspevku sa posnažím pridať aj novší výskum poukazujúci na paralely medzi pravdepodobnostnou a entropickou interpretáciou.

Koncept entropie pochádza zo štatistickej mechaniky. Fyzici sa v mnohých prípadoch zaoberajú problémami, kde je globálna vlastnosť systému daná, z nej treba odvodiť inú globálnu vlastnosť. Vzťah medzi týmito kvantitami je však sprostredkovaný interakciou jednotlivých elementov, ktorých stav a vlastnosti nepoznáme alebo nás nezaujímajú. Prirodzený spôsob ako tieto interakcie modelovať je použiť teóriu pravdepodobnosti a namiesto stavu jednotlivých častíc modelovať rozdelenie pravdepodobnosti rôznych stavov. Napríklad, v pôvodnej formulácii problému, ktorou sa zaoberal Gibbs na prelome 18. a 19. storočia nás zaujíma priemerná energia systému, vplyv rôznych manipulácii (napr. pridanie teploty) na energiu a naopak vplyv energetických zmien na iné vlastnosti systému (napr. tlak). Namiesto energetického stavu jednotlivých častíc modelujeme pravdepodobnosť p_i, že náhodne vybraná častica má energiu E_i. Tieto sú dané frekvenciami častíc s danou energiou  p_i = n_i / \sum_i n_i. Energetický stav častíc nepoznáme. Tým pádom ani rozdelenie pravdepodobnosti nie je známe. Známe sú globálne vlastnosti ako celková energia systému alebo teplota. Pridaním jedného dôležitého predpokladu v ktorom hrá entropia dôležitú rolu získame Boltzmanovo rozdelenie pravdepodobnosti pre rôzne energetické stavy:

p(E_i) = \frac{\exp (-E_i / T) }{Z(T)}

kde Z je normalizačná konštanta Z(T)= \sum_i \exp (-E_i / T) a T je teplota. Toto rozdelenie pravdepodobnosti môžeme použiť pri ďalších výpočtoch a napríklad odvodiť rovnicu pre tlak ideálneho plynu P= T/V.

Tento postup môžeme použiť ako všeobecný princíp pre definovanie rozdelenia na základe útržkovitej globálnej informácie. Toto je práve to čo bayesiánov zaujíma. Teoreticky musíme špecifikovať pre bayesiánsku analýzu apriori rozdelenie pravdepodobnosti parametrov. Každej možnej hodnote musíme prideliť pravdepodobnosť. V prípade premenných so spojitou množinou hodnôt je táto množina nekonečná. Tomuto problému sa možno vyhnúť cez špecifikáciu funkciu mapujúcej hodnoty parametrov na pravdepodobnosť. Množina potenciálnych funkcii však nie je o moc konečnejšia. Štatistici nemajú takéto presné apriori znalosti, resp. nemajú čas na to svoje informácie precízne kvantifikovať. Z praktických dôvodov preto vedci kvantifikujú svoju apriori znalosť len zhruba. Hrubú informáciu môžeme interpretovať ako globálne vlastnosti s ktorými narába štatistická mechanika a môžeme použiť podobných postup aby sme sa od hrubej informácie dopracovali k precíznemu rozdeleniu pravdepodobnosti – t.j. aby sme našli prior ktorý nám umožní naštartovať bayesiánsku inferenčnú mašinu.

Tento postup odvodenia rozdelenia pravdepodobnosti z hrubej informácie funguje nasledovne. Predstavme si, že máme malé kvantá pravdepodobnosti – celkovo ich máme n a našou úlohou je prideliť tieto kvantá každej hodnote i určitého parametra tak že výsledná suma pridelených kvánt n_i určuje pravdepodobnosť p_i=n_i/n.

Predstavme si, že sme náhodne zvolili určité rozdelenie n_1, n_2, \dots , n_m . (m je počet nádob medzi ktoré kvantá rozdeľujeme – t.j. počet možných hodnôt ktoré naša premenná môže nadobudnúť.) Aká je pravdepodobnosť tohoto rozdelenia pravdepodobnosti? (Pýtať sa na pravdepodobnosť pravdepodobnosti nie je problematické akurát, musíme dať pozor aby sme sa medzi toľkými pravdepodobnosťami jazykovo nezamotali a nestratili.) Táto je daná multinomiálnym rozdelením ako

p(n_1, n_2, \dots , n_m) = m^{-n} \frac{n!}{n_1! n_2! \dots n_m!}

Teraz nasleduje dôležitý trik. Ako zvoliť správne rozdelenie, ak nemáme žiadnu konkrétnu informáciu ako by toto malo vyzerať? Nie všetky rozdelenia sú rovnako pravdepodobné. Chytrou voľbou je preto zvoliť to najpravdepodobnejšie rozdelenie. Toto získame tradične ak nájdeme maximum vyššie uvedenej funkcie.

Skôr než pristúpime k hľadaniu maxima chceme multinomiálne rozdelenie trochu upraviť aby sa nám s ním lepšie pracovalo. Po prvé odstránime nemotorné faktoriály pomocou Sterlingovej aproximácie. Druhým problémom je že v skutočnosti, samozrejme, žiadne diskrétne kvantá pravdepodobnosti neexistujú. Pravdepodobnosť je spojitá kvantita. Tohoto problému sa zbavíme matematicky cez n_i \rightarrow \infty a n \rightarrow \infty. V tomto prípade sa p_i blíži konštantnej hodnote v rozpätí medzi 0 a 1. Ako výsledok týchto dvoch manipulácii získame

\frac{1}{n} log(p(n_1, n_2, \dots , n_m)) \rightarrow - \sum_{i=1}^m p_i log(p_i) = H(p_1,\dots, p_m)

Multiplikácia \frac{1}{n} a logaritmus sú monotónne operácie, nemenia preto pozíciu maxima a maximalizácia p(n_1, n_2, \dots , n_m) je preto ekvivalentná maximalizácii funkcie H(p_1,\dots, p_m) za podmienky, že \sum_{i=1}^m p_i = 1.  K hľadaniu maxima sa dostaneme za okamžik. Najprv si však rozoberme, čo sme získali vyššie uvedenou úpravou multinomiálneho rozdelenia. Tí zbehlejší už vedia, že H nie je hocaká funkcia, ale vyjadruje entropiu rozdelenia. Entropia vyjadruje očakávaný (=priemerný) informačný obsah rozdelenia. Rozdelenia pri ktorých si nemôžeme byť istý aké hodnoty očakávať majú vyšší informačný obsah a teda vyššiu entropiu. Ak entropiu interpretujeme ako neistotu rozdelenia môžeme preformulovať našu stratégiu maximalizácie entropie aj nasledovne. Ak nemáme detailnejšie informácie o rozdelení tak najpoctivejšou voľbou je zvoliť rozdelenie s najvyšším stupňom neistoty.

Vyššie sme použili Sterlingovu aproximáciu. Táto aproximácia je presná ak hľadáme logaritmus faktoriálu, čo je náš prípad. Najpravdepodobnejšie rozdelenie samozrejme nemusí byť to správne. Aká je pravdepodobnosť, že sa mýlime? Pointa je v tom, že s rastúcim n presnosť našej voľby rapídne stúpa. To možno preukázať ak odvodíme očakávanú odchýlku vyššie uvedeného multinomiálneho rozdelenia. Obidva aproximačné kroky teda nie sú prekážkou a bez strachu sa môžeme pustiť do hľadania rozdelenia s maximálnou entropiou.

Toto získame ak maximalizujeme H(p_1,\dots, p_m) za podmienky, že \sum_{i=1}^m p_i = 1. Maximum možno najsť tak že najprv vyjadríme jeden faktor p_k = 1-\sum_{i \neq k} p_i , dosadíme p_k do H a následne maximalizujeme. V praxi je viac zaužívaná elegantnejšia metóda Lagrangeových multiplikátorov. Táto nám hovorí, že náš problém vyriešime maximalizovaním funkcie  H- (\lambda_0 - 1) \sum_{i=1}^m p_i pre p_i \lambda_0 . Ako výsledok získame p_i = exp(-\lambda_0)\lambda_0 = log(m) a teda p_i =1/m. Maximalizáciou entropie sme získali rovnomerné rozdelenie. Najlepší odhad rozdelenia v prípade, že o ňom nemáme žiadne informácie tvorí rovnomerné rozdelenie. Metóda maximalizácie entropie (ME) nám teda umožnila odvodiť z globálnej informácie aké konkrétne apriórne rozdelenie pravdepodobnosti máme použiť.

Táto metóda funguje nielen v prípade keď nemáme žiadne informácie ale aj v prípade ak niečo vieme. Ak napríklad hľadáme rozdelenie pre pozitívnu premennú s priemerom \mu ME nám povie že máme použiť exponenciálne rozdelenie s parametrom \mu. Ak hľadáme spojité rozdelenie a poznáme priemer aj odchýlku rozdelenia ME nám poradí gausovské rozdelenie pravdepodobnosti s daným priemerom a odchýlkou.

Všeobecne ak poznáme pre funkcie f_k(x) ich očakávané hodnoty F_k = \sum_{i=1}^m p_i f_k(x_i) tak hľadáme maximum pre funkciu

H- (\lambda_0 - 1) \sum_{i=1}^m p_i - \sum_{j=1}^n \lambda_j \sum_{i=1}^m p_i f_j(x_i) .

Riešenie tvorí vyššie spomenuté Boltzmanovo rozdelenie:

p_i = \frac{1}{Z(\lambda_1, \dots, \lambda_n)} \exp (-\sum_{j=1}^n \lambda_j f_j(x_i) )

kde \lambda_i možno získa deriváciou funkcie log(Z)+\sum_{k=1}^n \lambda_k F_k vzhľadom na premennú F_k.

V tomto príspevku som ukázal ako ME funguje. V nasledujúcom príspevku rozoberiem problémy ME metódy a prečo pomocou nej nie je možné odvodiť objektívne apriórne pravdepodobnosti ako si Jaynes od tejto metódy sľuboval.

Milner & Goodale: Visual Brain in Action

Medzi výskumníkmi kognície nájdeme neveľkú ale za to dosť hlasitú komunitu s vyhraneným názorom – nazvime ich motorickí šovinisti. Títo výskumníci sa zaoberajú primárne motorikou. Na rozdiel od kolegov, ktorí dokážu skúmať rozhodovanie, motiváciu alebo pamäť bez väčších presahov do iných domén, skúsenosťou našich motorických šovinistov je, že motoriku nie je možné oddeliť od (vizuálneho) vnímania a vskutku všetkých ostatných domén kognície. Naopak, keď sa motorický šovinisti pozrú na tradičný výskum vnímania (napr. Marr, 1982), v tomto nevidia veľký zmysel. Vnímanie je študované v izolácii od motoriky a teda v neekologických podmienkach. Takýto výskum nevyhnutne dospeje k nesprávnym teóriám a záverom. To isté platí aj o výskume v ostatných doménach, ktoré využívajú vnímanie ako neutrálnu vstupnú bránu a motoriku vo svojom dotazníkovom ošiali úplne ignorujú.

Čo sa týka ultimátnej perspektívi majú motorickí šovinisti jasno. Vnímanie je na to, aby umožnilo organizmom motoricky interagovať zo svojim prostredím. Pomalé a nešikovné organizmy sú mŕtve organizmy. Rastliny nemajú zmysli, nervy a mozgy, lebo sa nehýbu. Kritickým evolučným stupňom pri vývine moderného človeka bol homo habilis a homo sapiens bol už len nevyhnutným následkom. Kde sú jazyk, vedomie, morálka, krásno, láska a všetky tie úžasné ľudské výdobytky? Všetko sú to vedľajšie produkty na fylogenetickej trajektórii überzručného šimpanza. (Ako ilustráciu si môžete prečítať napríklad špekulácie Andrew Wilsona o tom že jazyk sa vyvinul ako vedlajší produkt schopnosti hádzať.)

Ideovo sú si motorický šovinisti blízki s ekologickými psychológmi a so zástancami stelesnenej mysle. Tieto vedecké komunity sa často prelínajú. Naopak od zvyšku vedeckej komunity sú dosť izolovaný. Dôvodom ich izolácie (okrem ideologických dôvodov) od diania v ostatných doménach psychológie je zrejme špeciálna metodológia skúmania motoriky. Výskum motoriky vyžaduje špeciálne senzory a snímače. Takisto musia vedci poznať anatómiu kĺbov a svalov, aby vedeli aké stupne voľnosti ľuďom ich telesná stavba umožňuje a kam a ako upnúť snímače. Takéto technologické požiadavky vysvetľujú relatívne neskorý príchod motorických šovinistov na akademickú scénu až koncom 80. rokov. Dovtedy bol výskum motoriky výsadou zopár priekopníkov, ktorí boli ochotní si na vlastnú päsť navrhnúť a zostrojiť meracie prístroje.

Knihu od Milnera a Goodalea, dvoch britských neuropsychológov je možno považovať ako manifest tohoto hnutia. Dôvodom jej úspechu je zrejme umiernená pozícia autorov, ktorý navrhujú strednú cestu medzi ekologickou psychológiou Gibsona a tradičným reprezentacionalistickým prístupom. Milner a Goodale navrhujú, že obidva prístupy sú valídne pretože myseľ pozostáva z obidvoch typov mechanizmov – z reprezentácii ale aj z reflexných senzomotorických obvodov. Tu však prichádza najodvážnejšie a najkontroverznejšie tvrdenie. Autori tvrdia, že tieto mechanizmy prechádzajú mozgom ako dva viacmenej nezávislé prúdy informačného spracovávania. Dorzoparietálny prúd (DPP) je rýchly, podvedomý a riadi motoriku a automatizované správanie. Ventromediálny prúd (VMP) je pomalý, vedomý a riadený volíciou. Autori ponúkajú radikálne odlišnú architektúru mysle ako pred nimi Chomsky, Fodor a Marr. O týchto rozdieloch som už písal v článku o modularite a preto tu len pripomeniem moje schematické znázornenie rozdielov. Druhá schéma je blízka predstave Milnera a Goodela.

Milner a Goodale sa inšpirovali v neurobiológii, kde má napr. u žiab komplexné správanie reflexívny charakter. Akurát reflexívne okruhy bežia priamo cez mozog a sú komputačne dosť komplexné. Ich prístup je tak evolučný a v priamom kontakte s biológiou a neurovedami – dosť v kontraste so samozvanými nativistami reprezentacionalistického razenia, ktorí svoju cestu k neurobiológii nikdy nenašli.

VBA je veľmi zaujímavá aj z historického hľadiska. Kniha bola napísaná tesne pred nástupom skenerov a tak poskytuje pohľad ako sa robila neuroveda bez týchto meracích prístrojov. Teoretizovanie bez výsledkov zo skenerov rozhodne nebolo ľahké a kniha obsahuje tématické okruhy, ktoré by sme dnes už v knihe o mozgu ťažko našli. Druhá kapitola je napríklad venovaná šimpanzom. Nie preto, že by mozog šimpanza bol zaujímavý. Dokonca sa v dobe písania ani nevedelo nakoľko je mozog šimpanza funkčne podobný tomu ľudskému. Experimenty na šimpanzoch však boli často jedinou možnosťou ako zistiť niečo o funkčnej architektúre mozgu. Ak nie toho ľudského tak aspoň o anatomicky podobnom mozgu nášho najbližšieho evolučného predchodcu. Načastejšou metódou bolo monitorovanie akčných potenciálov jednotlivých neurónov. Týmto spôsobom napríklad Hubel a Wiesel objavili topografické rozdelenie On-Off neurónov vo V1.

Autori ukazujú, že anatomicky môžeme nájsť v mozgu dva paralelné prúdy, ktoré prebiehajú oddelene v postate od receptorov na retine až po motorické výstupy mozgu. Signály z retiny vedú dva typy tzv. magno- a parvobunky. Magnobunky vedú globálnu informáciu a ústia cez vizuálne oblasti prevažne ventromediálne, zatiaľčo parvobunky vedú lokálnu informáciu a ústia dorsolaterálne. DPP má kontakt k subkortikálnym oblastiam, ktoré riadia automatický pohyb očí, hlavy a orientovanie v priestore. DPP ústi bezprostredne do motorického kortexu. Ventromediálny prúd (VMP) naopak ústi v prefrontálnom kortexe, kde poskytuje informáciu pre plánovanie a rozhodovanie a až z PFC vedú spojenia naspäť do motorických oblastí a preč z mozgu. Toto anatomické rozdelenie si všimli vedci už pred VBA a bolo jedným z dôvodov prečo Ungerleider a Mishkin (1982) postulovali tiež dva paralelne prúdy – DLP reprezentujúci “kde” informáciu, kde sa objekt nachádza, ako je orientovaný a VMP popisujúci “čo”, ako objekt vyzerá, ako ho kategorizovať. Milner a Goodale preberajú anatomické rozdelenie avšak nesúhlasia s interpretáciou aktivity týchto dvoch neuroanatomických prúdov. Podľa VBA sa prúdy líšia v ich účeloch. DLP má rýchlo poskytnúť informáciu pre správanie, pre pohyb končatín, očí a hlavy. Naopak VMP spracováva informácie pre dlhodobejšie účely, pre pamäť, plánovanie a neskoršie vedomé rozhodovanie. Nie je ťažké si predstaviť prečo Ungerleider a Mishkin nesprávne interpretovali aktivitu prúdov. Informácia o výzore a identite objektu je viac užitočná pre pamäť a plánovanie. Naopak priestorové vlastnosti sú dôležité pre uchopenie a použitie objektu. Avšak tieto dve interpretácie nie sú úplne paralelné. Pozíciu a orientáciu objektu možno použiť pre kategorizáciu a v tomto prípade by sme očakávali, že spracovanie prebieha VM. VBA ďalej predpovedá existenciu neurónov v DLP ktorých aktivita je modulovaná motorickou aktivitou. Toto je napr. prípad neurónov v LIP ktorých aktivita je modulovaná okrem stimulu aj pohybom očí (viac som o tom písal tu).

Ďalšie tri kapitoly sa zaoberajú neuropsychologickou evidenciou. Autori ponúkajú dva komplementárne prípady, kde je jeden mozgový prúd zachovaný zatiaľčo ten druhý je poškodený.

Podľa autorov blindsight je prípadom poškodeného VMP. Blindsight je poškodením V1, ktorým prebiehajú spojenia ku VMP aj DPP. Avšak keďže do DPP vedú aj ďalšie spojenia mimo V1 možno predpokladať, že VMP bude úplne vyradený, zatiaľčo DPP si zachová akú-takú funkčnosť. Blindsight pacienti nemajú vedomý prístup k svojim vnemom, ktorý by verbalizovali, avšak ich zachovalý DPP im umožní relatívne spoľahlivo odhaliť stimulus ak pacient odpovedá žmurknutím alebo stlačením klávesy. Takisto blindsight pacienti dokážu ukázať pohľadom (pohybom oka a hlavy) alebo prstom na zdroj svetla ktorý nevidia. Pacienti sú síce nepresní (odchýlka 20-30 stupňov) avšak ich ukazovanie je spoľahlivejšie ako keby mali náhodne hádať.

Samozrejme existujú aj prípade, kde VMP je poškodený priamo zatiaľčo vizuálny kortex a DPP sú zachované. Takýto pacienti vidia objekty avšak trpia rôznymi formami agnózie. Milner a Goodale popisujú svoju agnostickú pacientku D.F. D.F. dokáže rozoznať tvary, textúry, kontúry a farby avšak nespozná objekt a nevie ho ani obkresliť. Samotný objekt pritom vie nakresliť (avšak objekt ktorý nakreslila znovu nespozná). Niektoré skutočné objekty dokáže rozoznať avšak len na základe vzhľadu ich povrchu. Zaujímavé pritom je, že D.F. nemá problémy vyhnúť sa prekážkam, uchopiť objekt alebo chytiť loptu. D.F. takisto nemala problém vložiť ruku do orientovanej úzkej medzery. Ak však mala popísať orientáciu medzery (bez toho že by do nej vložila ruku) tak jej úsudok bol mizerný – v podstate hádala. Autori takisto spomínajú tzv. topografické agnózie. Takýto pacienti majú problém sa orientovať na mape a postihnuté sú ventromediálne oblasti mozgu. Takéto prípady jasne hovoria proti hypotéze, že DPP reprezentuje priestorovú informáciu. Naopak tieto prípady sú konzistentné s teóriou Milnera a Goodalea. Topografická orientácia neslúži pre motorickú koordináciu ale je formou reprezentácie prostredia v pamäti a ako taká spadá pod VMP.

Ak sa pozrieme na DPP, tak tu sú výsledkom poškodenia rôzne formy ataxie – neschopnosť pohybovej koordinácie, napríklad neschopnosť uchopiť objekt. Tieto poruchy boli interpretované v kontexte teórie Ungerleidera a Mishkina ako poruchy priestorového vnímania. Milner a Goodale poukazujú na to, že tieto poruchy sú špecifické pre konkrétnu motorickú modalitu. Napríklad pacient nevie ukázať prstom, ale vie uprieť zrak na objekt, čo znamená, že priestorová reprezentácia vo všeobecnosti nie je narušená. Naopak niektorí ataktici vykazujú ďalšie problémy, ktoré sú spojené skôr s modalitou ako s priestorovým vnímaním. Pacienti majú problém správne orientovať ruku tak aby mohli uchopiť. Obrázok nižšie ukazuje body (spojené čiarou) v ktorých pacienti D.F. (agnózia), R.V. (ataxia) a zdravý probant uchopili objekt. D.F. a zdravý probant orientujú prsty správne tak, že úsečka medzi nimi prechádza ťažiskom objektu, zatiaľčo ataktik R.V. má v tomto pohľade evidentné problémy.


Až posledná šiesta kapitola sa zaoberá evidenciou z experimentov so zdravými ľudskými probandmi. Ide väčšinou o behaviorálne experimenty, ktoré ukazujú na rozdiely v citlivosti dvoch postulovaných prúdov na vizuálne ilúzie. Napr. pri Titchenerových kruhoch znázornených nižšie sa nám javí stredový kruh na ľavo menší ako stredový kruh na pravo. Pritom sú obidva kruhy rovnako veľké. Milner a Goodale zistili, že zatiaľčo náš vedomý úsudok sa nechá zmiasť, ak zasadíte medzi kruhy mincu, poviete probantovi aby ju uchopil a odmeráte roztvorenie prstov, tak v tomto prípade probant ilúziou netrpí. To znamená, že motorika používa inú informáciu ako náš verbálny úsudok.


Teória dvoch prúdov prezentovaná vo VBA sa stala terčom kritiky. Ako bolo spomenuté najodvážnejšie tvrdenie bolo, že dva prúdy sú izolované – téza ktorá sa v mozgu, kde je notoricky spojené všetko so všetkým ťažko preukáže. Nástupom skenerov sa ukázalo, že táto teória je moc zjednodušená. Obidva prúdy interagujú a vymieňajú si informácie. Teóriu z VBA možno vylepšiť a revidovať napríklad tak aby zahŕňala tri prúdy alebo aby akceptovala výmenu informácie, tým však hrozí, že sa teória stane bezobsažnou. Milner a Goodale ponúkajú svoje vylepšenia v siedmej kapitole, ktorá pribudla v druhej edícii knihy alebo v novšom review článku (2008).

Na empirickej fronte boli aj výsledky prezentované vo VBA spätne napadnuté. Franz et al. (2000) spochybnili spoľahlivosť a všeobecnosť behaviorálnych experimentov s ilúziami. Schenk (2012) zasa tvrdí, že pacientka D.F. nezvládne motorické úlohy ak sú tieto lepšie kontrolované. Nech je tomu akokoľvek, myslím, že najzaujímavejším prínosom VBA je jej radikálne odlišný pohľad na architektúru mysle. Tento možno neplatí vo forme veľkého plánu dvoch prúdov prebiehajúcich paralelne mozgom. Avšak v rámci systémov a podsystémov mozgu môžu paralelné prúdy poskytnúť zaujímavú a užitočnú komputačnú metaforu.

Franz, V. H., Gegenfurtner, K. R., Bülthoff, H. H., & Fahle, M. (2000). Grasping visual illusions: No evidence for a dissociation between perception and action. Psychological Science, 11(1), 20-25.

Marr, D. (1982). Vision: A computational investigation into the human representation and processing of visual information, Henry Holt and Co. Inc., New York, NY.

Milner, A. D., & Goodale, M. A. (1995). The visual brain in action. New York: Oxford.

Milner, A. D., & Goodale, M. A. (2008). Two visual systems re-viewed. Neuropsychologia, 46(3), 774-785.

Schenk, T. (2012). No dissociation between perception and action in patient DF when haptic feedback is withdrawn. The Journal of neuroscience, 32(6), 2013-2017.

Ungerleider, L., & Mishkin, M. (1982). Two cortical visual systems. Analysis of Visual Behavior. MIT Press, Cambridge, MA.

Dve slávne publikácie

Jedným dôsledkom nefunkčného vedeckého publikačného systému je, že vedci publikujú kopu odpadu, ktorý by úprimne povedané nemusel uzrieť svetlo sveta. Tento fenomén je paradoxne produktom exkluzivistického peer review, v ktorom je publikačný priestor obmedzený. Vedci sa snažia publikovať čo najviac, najrýchlejšie a v renomovaných časopisoch. Publikácia sa stáva komoditou samou o sebe a nie prostriedkom komunikácie, čo bol jej pôvodný cieľ. Vedci publikujú viac, zároveň nemajú čas čítať toľké publikácie. Ťažko zhodnotiť prácu iného vedca ak ju nepoznáme. Musíme tak použiť rôzne heuristiky, aby sme zhodnotili jeho akademickú produktivitu. Hodnotenie nahrádzajú indikátory ako impact factor alebo počet publikácii. Tým sa ďalej odlučuje obsah od hodnotenia kvality a bludný kruh sa uzatvára. Viacerí vedci tak varujú, že dôležitý krokom pri reforme publikačného systému je akceptovanie faktu samotnými vedcami, že musia začať publikovať menej. Takáto reforma nie je nemožná. Mohli by vzniknúť špeciálne vedecké časopisy, ktoré umožnia autorom publikovať len raz za dva-tri roky. Ak by sa takéto publikácie stali atraktívne vedci by tak boli motivovaní investovať viac do kvality publikácie.

Tým samozrejme nemusíme hneď skočiť k cenzúre. Zlatou cestou je ponúknuť vedcom rôzne publikačné formáty. Každý nech si vyberie, či chce radšej chrliť rýchle splaškové publikácie alebo sa dôkladne dlhodobo venovať jednému projektu. V súčasnom publikačnom prostredí je dominantnou stratégiou dôraz na kvantitu.

Nejaký čas ešte potrvá kým prejde publikačný systém reformou. Dočasnou alternatívnou stratégiou môže byť parodovanie zbytočných publikácii a zbytočného výskumu. Mám na mysli sarkastický editoriál Petra Eliasa o dvoch “slávnych” publikáciach. Samotný editoriál má len jednu stranu a odporúčam ho prečítať. Dve slávne publikácie sú samozrejme dva vzory pre publikácie bez ktorých by sa vedecký svet podľa Eliasa kľudne zaobišiel. Elias konštatuje “These two papers have been written—and even published-often enough by now. I suggest that we stop writing them, and release a large supply of manpower to work on the exciting and important problems which need investigation.” Témy týchto dvoch publikáciu reflektujú svoju dobu ale ich pohrobkov nájdeme na stránkach časopisov aj dnes. “The first paper has the generic title “Information Theory, Photosynthesis and Religion”, and is written by an engineer or physicist. It discusses the surprisingly close relationship between the vocabulary and conceptual framework of information theory and psychology (or genetics, or linguistics, or psychiatry, or business organization).” Problémom takejto publikácie je že je moc všeobecná jej závery tým triviálne a banálne. Samozrejme dotyčný autor mohol zariskovať interdisciplinárny výlet a použiť informačnú teóriu na modelovanie skutočných dát. Žiaľ nie v tejto publikácii. Táto úloha padne na plecia psychológom (genetikom, lingvistom), ktorí sa svojej úlohy nepochybne hneď chopia akoby im práve bola zjavená prvá solídna teória vysvetľujúca ľudskú myseľ (genóm, jazyk). Téma druhej publikácie je trochu špecifická pre svoju dobu. Vedci v 50. a 60. zistili, že viaceré techniky spracovania signálov možno odvodiť štatisticky. Autor druhej slávnej publikácie väčšinou odvodil nový úžasný štatistický model. Tento sa však ukázal ako ťažko vypočítateľný (či už pomocou vtedajšej technológie alebo vôbec), takže vedec musel začať zjednodušovať. Po viacerých zjednodušenia sa dopracoval k už existujúcej technike. Jeho odvodenie však poskytlo nový pohľad a zdôvodnenie už existujúcej techniky a preto ho bolo nutné publikovať

Na dve slávne publikácie sa možno pozrieť z viacerých uhlov. Norbert Bischof hovorieval, že vo vedeckom svete sa s enormným nárastom informácii a výskumu postupne presadzujú dve dominantné stratégie výskumu.  Špecialisti vedia postupne viacej o stále zmenšujúcom sa vedeckom výseku. Interdisciplinárni polygloti vedia postupne relatívne menej o stále zväčšujúcom sa celkovom zábere vedy. Až na konci vekov jedni vedia všetko o ničom a druhí vedia nič o všetkom, zvykol Bischof dodať sarkasticky. Autor prvej publikácie je polyglot. Ponúka psychológom teóriu všetkého. Akurát táto teória je taká všeobecná až je bezobsažná a nezaujímavá. Autor druhej publikácie je špecialista. Postupné zjednodušovanie modelu sa deje v kontexte konkrétnej aplikácie. Konečný rozsah aplikácie je však tak obmedzený že sa daný model a algoritmus stáva prakticky nezaujímavý.

Z pohľadu Conwayovho diagramu (viď nižšie) môžeme interpretovať prvú slávnu publikáciu ako nesprávnu aplikáciu matematiky (zelená). Ak sa takto deje bez kontaktu ku konkrétnej aplikácii výsledkom budú abstraktné bezobsažné a ťažko testovateľné teórie. Druhú slávnu publikáciu možno interpretovať ako extrémnu aplikáciu hackovania. Ako hackovanie možeme označiť zjednodušovanie matematických modelov tak aby tieto mohli byť implementované. Ak je však hackovanie dominuje, výsledná aplikácia sa vzdiali svojmu  matematickému a štatistickému fundamentu na toľko, že tento je pre jej fungovanie prakticky irelevantný.

Nakoniec sa môžeme zamyslieť aké slávne publikácie by sme našli v kognitívnych vedách dnes. Určite nájdeme extrémnych špecialistov. Článok o paralelnom spracovávaní časopriestorovej informácie vnímania galopovitého pohybu organizmov  v laterálnom postero-parietálnom ľaloku už nepochybne bol napísaný. Na strane bezobsažnej všeobecnosti nájdeme psychologické just-so stories. Určite sa dozvieme o evolučnej adaptívnosti modulu spôsobujúceho mravčenie na zátylku. Dozvieme sa o heuristike umožňujúcej vyhodnotenie dvojitej negácie abduktívneho výroku a pomocou nej lokalizáciu kigo frázy v haiku veršoch. Pre každý nový nevysvetlený vzor správania môžeme sformulovať nový modul alebo navrhnúť novú heuristiku. Takáto teória mysle je kvôli svojej bezobsažnej všeobecnosti rovnako nezaujímavá ako informačná teória fotosyntézy a náboženstva.
Elias, P. (1958). Two famous papers (Edtl.). Information Theory, IRE Transactions on, 4(3), 99-99.

Bayesiánsky model intencionálnej stratégie

V minulom príspevku sme videli príklad ako si filozofi nevedia dať rady s pripisovaním významov, cieľov alebo účelov udalostiam okolo nás. Nielenže sa filozofi pýtajú nesprávne otázky, ktoré sú irelevantné pre vedu a praktický život, ale nepýtajú sa tie správne otázky, ktoré vedcov a ľudí zaujímajú. Diskusie o existencii a podstate cieľov musíme nahradiť epistemologickými otázkami – aká je optimálna stratégia pre pripisovanie cieľov a účelov a  nakoľko sa ľudské rozhodovanie od tejto stratégie odkláňa. Či je účel a význam, ktorý ľudia svojmu konaniu pripisujú metafyzická apriórne večná entita levitujúca na dne 42. komnaty sveta ideí alebo tvorí len ilúziu prudko blikajúcich fermiónov a bozónov je irelevantné. Namiesto toho sa musíme pýtať ako ľudia pripisujú dianiu okolo seba význam a či existuje lepšia stratégia, pomocou ktorej by bolo možné správanie ľudí vylepšiť. Toto sú otázky ktoré si kladú psychológovia a informatici.

Baker, Saxe a Tenenbaum (2009) nedávno ponúkli model, ktorý teleologickú stratégiu ľudí popisuje. Tento model je zároveň vybudovaný na princípoch optimálnej racionality, takže sa zdá že aspoň v určitých situáciach je ľudské rozhodovanie optimálne a v tomto zmysle aj veridikálne. Baker et al. formalizovali skoršie návrhy intencionálnej stratégie u Dennetta (1989) a teologickej stratégie u Gergelyho a Csibru (2003). Tieto návrhu sa snažia zodpovedať zásadné otázky. Ako pripisujú ľudia správaniu iných aktérov ciele? Ako predpovedajú budúce správanie na základe toho predchádzajúceho? Ľudia robia tieto inferencie neustále a zjavne bez väčšieho úsilia. Často až následná reflexia nám umožní oceniť komplexnosť našich úsudkov. Môj obľúbený príklad je dopravná situácia ktorú som pravidelne zažíval v Mníchove cestou domov pri prestupovaní z metra na autobus. Odchod autobusu bol nataktovaný v závislosti od príchodu metra – v závislosti od teoretického príchodu metra. Metro niekedy meškalo a niekedy meškal autobus.  Medzi príchodom metra a odchodom autobusu bola medzera dvoch minút na presun. Presun v podstate tvoril len (dosť dlhý) východ z metra – ca. 100 metrov hore po schodoch. Zmeškať bus nebolo príjemné, keďže človek si potom musel počkať 10, v neskorších hodinách 20 minút na ďalší. A nebolo to ani nevyhnutné, stačilo vedieť či sa bus nachádza na zastávke. V podzemí to však nebolo možné zistiť. Človek mohol ísť vždy na istotu a rozbehnúť sa o život hore schodmi. V drvivej väčšine prípadov bol však taký beh zbytočný, keďže bus bol už buď preč alebo prišiel neskôr. Dav skúsených cestujúcich vystupujúcich na (konečnej) zastávke metra však vytvoril zaujímavú sociálnu dynamiku. Z nádražia bolo možné dovidieť na vrch schodov. Z vrchu bolo možno dovidieť zasa k východu z metra. Z východu bolo možné dovidieť na zastávku. Autobus síce nebolo možné vidieť ale bolo možné vidieť čakajúcich ľudí a či sa títo zberajú na nástup. Ak sa tak dialo, bol to signál pre tých pri východe aby pobehli ak chcú stihnúť autobus. Východ bolo zasa možné vidieť z vrchu schodiska a vrch schodiska z nástupiska. Takto stačilo každému posúdiť či ľudia pred ním bežia a rozbehnúť sa v tomto prípade tiež.

Tento príklad pekne ilustruje intencionálnu stratégiu. Ostatným cestujúcim pripíšem cieľ – stihnúť autobus. Pozorujem ich správanie a základe správanie dokážem získať nové informácie o stave sveta a zodpovedajúco prispôsobím svoje správanie. Vznikne tak ľudská reťaz šíriaca informácia. Títo ľudia nemusia byť Čínania a nepotrebujú ani vysielačky. Intencionálna stratégia v tomto prípade reprodukuje informáciu perfektne. Skoro perfektne. Raz sa mi napríklad stalo, že som s davom vbehol do nesprávneho autobus, ktorý ma uniesol úplne opačným smerom. Samozrejme kto mal predpokladať, že sa na zastávke sa vyskytne autobus úplne mimo svojho taktu. Táto udalosť je málo pravdepodobná. Intencionálna stratégia nie je sto percentne spoľahlivá. Ako väčšina ostatných rozhodnutí ľudia musia narábať s pravdepodobnosťami ktoré reflektujú neistotu a nespoľahlivosť udalostí okolo nás. Hlavný prínosom Bakera et al. je práve pretavenie intencionálnej stratégie do probabilistického modelu. Dennett a aj Gergely a Csibra popísali intentionálnu stratégiu ako deduktívne usudzovanie. Ľudia samozrejme neposudzujú len udalosti ktoré so pravdivé alebo nepravdivé ale ich rozhodovanie ovplyvňujú aj udalosti ktoré sú menej alebo viac pravdivé.

Intencionálna stratégia nie je jediná stratégia ako posudzovať udalosti okolo nás. Ciele pripisujeme len aktérom – väčšinou organizmom (a často pixlom na monitore). Kľúčovým faktorom pri pripisovaní cieľov je racionalita aktéra. Ciele pripisujeme len správaniu racionálnych aktérov. Ultimátnym cieľom organizmov je prežitie a rozmnožovanie. V tomto zmysle môžeme hovoriť u organizmoch o racionálnych aktéroch. U aktérov, ktorý sa nesprávajú racionálne nemožno intencionálnu stratégiu použiť. Ľudia samozrejme pozorujú len správanie a tak je potrebné racionalitu tiež inferovať. Samotný fakt, že sa jedná o organizmus alebo človeka nemusí byť v danom kontexte postačujúci. U ľudí, ktorí sa hocikedy rozbehnú z ničoho nič nechcem zisťovať ich ciele a ich správanie mi nepovie nič o tom či na zastávke stojí autobus.

Ako funguje intencionálna stratégia? Tu je Dennettov popis:

 …first you decide to treat the object whose behavior is to be predicted as a rational agent; then you figure out what beliefs that agent ought to have, given its place in the world and its purpose. Then you figure out what desires it ought to have, on the same considerations, and finally you predict that this rational agent will act to further its goals in the light of its beliefs. A little practical reasoning from the chosen set of beliefs and desires will in many—but not all—instances yield a decision about what the agent ought to do; that is what you predict the agent will do.(Dennet, 1989, s. 17)

Gergely a Csibra pri svojom popise teleologickej stratégie rozlišujú tri inferencie, ktoré táto stratégia umožňuje. Na základe správania (A) a stavu prostredia (E) možno inferovať ciele (G). Ak vidím niekoho bežať k zastávke (A) a vidím prichádzať autobus (E) tak dá rozum že jeho cieľom je stihnúť autobus (G). Na základe znalosti cieľov a pozorovaného správania vieme zistiť stav prostredia. Toto bola situácia, keď som pri vychádzaní z metra nevedel či autobus stojí na zastávke (E) ale pozoroval som správanie ľudí okolo seba (A) a vedel som, že väčšina z nich sa ponáhľa lebo chcú stihnúť autobus (G). Nakoniec, na základe znalosti cieľov a stavu prostredia viem predpovedať správanie. Ak viem, že môj priateľ čaká na autobus (G) a vidíme autobus prichádzať (E) tak viem že sa so mnou rozlúči a poberie sa na zastávku (A). (Treba dodať, že teleologická stratégia ignoruje možnosť, že náš priateľ nepozná stav prostredia alebo má o ňom mylnú predstavu. V tomto aspekte sa teleologická stratégia líši od teórie mysle, ktorá umožňuje oveľa komplexnejšie inferencie.)
Gergely a Csibra ilustrovali tieto tri situácie pomocou nasledujúceho diagramu. Ilustrované sú aj animácie pomocou ktorých autori testovali schopnosť používať teleologickú stratégiu u kojencov. Kojenci boli habituovaní pomocou animácii vľavo kde pozorovali racionálne správanie aktéra. Následne boli kojenci konfrontovaní s udalosťami ktoré boli buď kompatibilné alebo nekompatibilné s teleologickou stratégiou. Kojenci boli viac prekvapení (pozerali dlhšie) pri nekompatibilných udalostiach – keď aktér preskočil neexistujúcu prekážku (A), keď sa prenasledovateľ nakoniec vyhol svojmu cieľu (G), alebo keď sa ukázalo, že za clonou sa nenachádza prekážka ktorú by aktér preskakoval.

Dennett a aj Gergely a Csibra ponúkajú deduktívne metódy. Ciele, stav prostredia a správanie tvoria neznáme premenné a racionalita aktéra ich drží pohromade. Dedukcia funguje ak poznáme dve z troch spomenutých skutočností plus racionalitu. Samozrejme deti a v mnohých situáciách ani dospelí nepoznajú stav premenných aby mohli deduktívnu stratégiu aplikovať. K tomu ešte prichádza fakt, že racionalitu aktéra musíme zistiť na základe správania. Vskutku správanie a čiastočný stav prostredia sú jediné informácie ktoré máme. Ľudia však nemajú problém na základe útržkovitých pozorovaní (mnohokrát úspešne) aplikovať teleologickú stratégiu. Z pohľadu deduktívnej logiky vyzerá ich inferencia ako jeden veľký podvod, kde ľudia vytiahnú sami seba za vlasy z močiara fyzikálnej evidencie. Vskutku filozofická literatúra je plná dôkazov ako teleologická stratégia nemôže fungovať s implikáciou, že teleologická stratégia je buď ilúzia, alebo na druhej strane barikády, že ľudská myseľ je super-turingovský kvantový zázrak. Obidve pozície sú z vedeckého hľadiska málo produktívne.

Strih. Fanfáry. Na scénu nastupuje bayesiánska štatistika aby zasa raz zachránila scientizmus obkľúčený impotentným fyzikalizmom na jednej strane a zbabelým mysteriánizmom na strane druhej. Baker et al. preformulovali teleologickú stratégiu do probabilistického modelu. Probabilistický model aplikovali na syntetické 2D svety s pohybujúcimi sa aktérmi a troma cieľmi. Taký svet vyzerá zhruba nasledovne.

Steny sú znázornené čiernou a červený kruh (aktér) sa cez ne nemôže dostať. Môže však preniknúť dierou na pozícii (9,7). Červený, zelený a biely štvorec tvoria potenciálne ciele. Aktér sa začne pohybovať a vašou úlohou je zistiť ktorý štvorec je jeho cieľovou destináciou a ktorým smerom sa pohne najbližšie. (V experimente bola animácia 3 krát zastavená na diagnostických pozíciach aby probandi mohli odpovedať).

Bayesiánsky model vyhodnocuje tieto otázky nasledovne. Pohyb aktéra tvoria diskrétne kroky aktéra v čase a_t. Pri každom kroku sa môže aktér vybrať ôsmymi smermi alebo ostať na mieste a teda a tvorí náhodnú premennú s 10 hodnotami. (Ak je aktér pri stene kroky do steny ho ponechajú na mieste.) V každom kroku sa nachádza aktér na určitej pozícii s_t. Napríklad pre animáciu vyššie platí s_0=(1,9), s_1=(2,8).

Ako zistiť na základe pozorovaného správania a_{1:t} a počiatočnej pozície s_0, ktorý cieľ aktér nasleduje? Bayesova veta. p(g|a_{1:t}) \propto p(a_{1:t}|g)p(g), kde p(g) je rozdelenie pravdepodobnosti cieľov. Ak nemáme apriori znalosť o preferenciách aktéra, dosadíme za apriori pravdepodobnosť rovnomerné rozdelenie p(g)=1/|G| v našom prípade p(g)=1/3. Vierohodnosť rozložíme nasledovne p(a_{1:t}|g) = \prod_{i=1}^t p(a_i|s_{i-1},g), kde sme postulovali, že správanie závisí len od súčasnej pozície a cieľa a nie ako sme na túto pozíciu dostali. Intuitívne, pre každú pozíciu a cieľ môžeme určiť najefektívnejšie správanie – t.j. to ktoré minimalizuje vzdialenosť k cieľu. Napríklad ak je cieľ vpravo dole tak takáto stratégia môže vyzerať nasledovne.

Náš algoritmus však chce byť probabilistický a zrejme aj pre ľudí hrá rolu či sa aktér na pozícii (9,4) pohol doľava alebo dole. Pohyb dolu nie je možno úplne optimálny avšak pohyb doľava je katastrofálny – smerom od daného cieľa. Pre každý pohyb a pre každú pozíciu tak získame rozdelenie pravdepodobnosti v závislosti ako efektívne dané správanie minimalizuje vzdialenosť k cieľu. Graficky môžeme vyjadriť toto rozdelenie odtieňom farby na 3×3 mriežke. Každé pole ukazuje určité správanie, viď. legenda vpravo.

Toto grafické znázornenie môžeme použiť pre aby sme ilustrovali rozdelenie pravdepodobnosti pre každú pozíciu.

Pre cieľ na pozícii (10,1) dostaneme odlišnú mapu.

Formálne zvolíme p(a_i|s_{i-1}) \propto exp(\beta V(s_{i-1},a_i)), kde V(s_{i-1},a_i)) je funkciou zmeny vzdialenosti smerom k cieľu. p(a_i|s_{i-1}) je Boltzmanove rozdelenie pravdepodobnosti známe zo štatistickej mechaniky, kde parameter \beta vyjadruje teplotu rozdelenia. Ako sa mení rozdelenie v závislosti od hodnoty \beta? Vyššie som vám ukázal mapu pre \beta=1. Tu je \beta=0.5

a \beta=5 vyzerá nasledovne

Pripomínam, že biela označuje vysokú pravdepodobnosť zatiaľčo čierna tvorí mizivú pravdepodobnosť. Nie je ťažké interpretovať \beta v rámci teleologickej stratégie. \beta vyjadruje racionalitu, ktorú aktérovi prisudzujeme. Baker et al. odhadli \beta pri modelovaní behaviorálnych dát ako dodatočný parameter. Zároveň ponúkli aj rozšírený model, ktorý odhadne \beta v každom kroku nanovo na základe správania. Nižšie sú znázornené inferencie daného modelu.

Hore vidieť správanie aktéra. Vľavo dole je znázornená pravdepodobnosť troch cieľov v závislosti od času. Nie je ťažké predpovedať pravdepodobnosť pre budúce správanie a_{t+1}. Platí p(a_{t+1}|a_{1:t}) = \sum_g p(a_{t+1}|g)p(g|a_{1:t}), kde obidve kvantity na pravej strane rovnosti sú známe. p(a_{t+1}|a_{1:t}) je znázornené vpravo dole. Všimnite si ako jeden diagnostický krok (napríklad na pozícii s_{12}=(11,8)) dokáže rapidne ovplyvniť rozdelenie pravdepodobnosti. Zároveň si všimnite ako sa na základe grafu vpravo dole mení racionalita aktéra. Rovnomerné rozdelenie (napríklad pri t=24) indikuje, že model si nie je celkom istý racionalitou aktéra a preto nedokáže ponúknuť spoľahlivé predpovede.

Vyššie som spomenul, že teleologická stratégia tvorí redukovanú verziu teórie mysle. V prebiehajúcom projekte Baker et al. (2011) modelujú teóriu mysle, takže sa máme na čo tešiť. Modelovanie kognitívnych fenoménov má aj zaujímavé aplikácie. Vskutku modeli podobné tomu od Baker et al. používajú informatici na inferovanie správania (napr. Verma a Rao, 2006). Tým vzniká bizarná situácia. Vedci namiesto toho, aby vymietli ľuďom iluzórne ciele z hláv, zabudujú tieto ilúzie ešte aj do umelých systémov. Pripomínam, že sa nejedná o žiadny kompromis v dôsledku nízkej výpočtovej sily počítačov. Intencionálna stratégia tvorí racionálne optimálnu metódu pre predpovedanie určitého druhu udalostí – a síce správania iných organizmov okolo nás.

Baker, C. L., Saxe, R., & Tenenbaum, J. B. (2009). Action understanding as inverse planning. Cognition.

Baker, C. L., Saxe, R. R., & Tenenbaum, J. B. (2011). Bayesian theory of mind: Modeling joint belief-desire attribution. In Proceedings of the thirty-second annual conference of the cognitive science society.

Dennett, D. C. (1989). The intentional stance. MIT press.

Gergely, G., & Csibra, G. (2003). Teleological reasoning in infancy: The naıve theory of rational action. Trends in cognitive sciences, 7(7), 287-292.

Verma, D., & Rao, R. (2006). Goal-based imitation as probabilistic
inference over graphical models. In Advances in neural information
processing systems (Vol. 18, pp. 1393–1400).

Rosenberg: Atheist’s Guide to Reality

Rosenbergovi vyšla minulý rok kniha určená pre širšiu verejnosť. Vydanie tejto knihy sprevádzali extatické reakcie na Massive Error a v ďalších kútoch českej filozofickej blogosféry. Samozrejme Mozgostroje nemôžu chýbať na mieste aby skontrolovali čo za neplechu to filozofi zasa napáchali. Ako predchádzajúce “recenzie” na Mozgostrojoch tento článok tvorí skôr diskusiu a polemiku a najviac informatívny bude pre ľudí ktorí knihu čítali.

Rosenbergovu knihu možno vnímať v kontraste k ostatnej ateistickej a naturalistickej literatúre ako je Dawkinsova God Delusion alebo Dennettova Darwins dangerous idea. Vskutku Rosenbergova AGR mi pripomenula Dennettovu DDI. Kniha má podobnú obsahovú stavbu. Rosenberg má však rýchlejší ťah na bránku a tak už po prvej tretine sme pri morálke teda tam DDI končí. Aj obsahovo možno AGR dobre kontrastovať s DDI, Dennett argumentoval pri odpovediach na večné otázky, že pohár je do polovice plný. Cieľe, plány, slobodná vôľa, ja – všetko existuje, akurát treba občas tieto veci na nerozoznanie predefinovať. Rosenberg argumentuje, že pohár je do polovice prázdny. Niektoré jeho definície sú tiež posunuté preč od bežného významu. Opačným smerom.

Namiesto hašterenia sa o definíciách a o tom či je pohár do polovice plný alebo prázdny, zaujímavejšie je pozrieť sa na Rosenbergove tézu z pohľadu racionálneho bayesiánskeho aktéra. Ak bude niekedy napísaný Matúšov návod na realitu tak na prvej strane bude varovanie, že všetky ontologické otázky treba vymeniť za otázky epistemologické. Ontologickými otázkami myslím otázky typu “Existuje X?” A ak áno “Čo je X?” Existuje boh? Existuje zmysel života a ak áno čo ním je? Má vesmír príčinu? Máme dušu? Máme slobodnú vôľu? Tieto otázku sú nesprávne formulované a vedú k irelevantným argumentom o tom či je pohár do polovice plný alebo prázdny. Treba ich vymeniť za epistemologické otázky “Akú pravdepodobnosť má racionálny aktér pri danom stave evidencie prisúdiť výroku X?”, kde výrok X môže byť kľudne aj výrok o existencii či neexistencii niečoho. Týmto sa podarí zamedziť neplodným diskusiám o poloplnosti/poloprázdnosti pohára, keďže pravdepodobnosť 0.5 je asi rovnako kontroverzná ako pravdepodobnosť 0.9 alebo 0.1. Pozrime sa či sa s týmto prístupom dostaneme ďalej ako Rosenberg, Dennett a ostatní.

AGR začína fyzikou, ktorá ostane Rosenbergovým ťažným argumentom po zvyšok knihy. Rosenberg tvrdí, že realitu tvoria fermióny a bozóny. Nič iné. Časticovou fyzikou som sa už na Mozgostrojoch zaoberal. V minulom článku sme aj videli, že fermióny a bozóny nie tak celkom existujú. Dané sú pozorovania zrážok častíc. Od nich k fermiónom a bozónom vedie inferenčný krok. Tento vyžaduje postulovanie určitých predpokladov a kritérii ako sú zachovanie vlastností, konzistentnosť alebo jednoduchosť. Bez týchto kritérii inferencia nie je možná. Bozóny a fermióny teda na nás z reality samy od seba len tak nevyskočia. Rosenberg krátko píše o validite inferencii vo fyzike: “We have the best of reasons to believe that the methods of physics—combining controlled experiment and careful observation with mainly mathematical requirements on the shape theories can take—are the right ones for acquiring all knowledge.” Ak myslí Rosenberg pod “mathematical requirements on the shape theories” epistemologické kritéria ako je jednoduchosť a konzistentnosť, tak je ten výraz trochu eufemizmus. Každopádne ak sú správnou cestou nadobúdania poznania, jednoduchosť ako argument môžeme použiť aj pri otázkach ohľadom cieľov, plánov a zmyslov v neskorších kapitolách, nie?

Validitu inferencie vo fyzike možno rozpitvať ďalej. Samotné poznatky ohladom zrážky častíc nie sú tvrdým faktom, ale tvoria ich dáta z viacerých experimentov, ktoré nemusia byť úplne konzistentné a treba ich štatisticky a inferenčne opracovať. Ďalej sa môžeme spýtať, prečo by sme mali akceptovať pozorovania z časticových detektorov. Rovnako dobre môžeme akceptovať pozorovania elementárnych častíc, ktoré vykonal Fero včera pod vplyvom psychofarmák. Treba si uvedomiť, že v tomto momente nemôžeme odmietnuť Ferove pozorovania ako halucinácie, keďže nemáme jasno ohľadom materialistickej fyziky na ktorej by sme potom argumentačne vybudovali ostatné vedy vrátane neurovedy, ktorá by vysvetlila Ferove pozorovania ako halucinácie. Neviem ako by tieto problémy riešil Rosenberg. Racionálny bayesiánsky aktér nemá s týmito otázkami problémy. Môže uplatniť nárok na konzistenciu a jednoduchosť popisu reality a uprednostniť materialistickú fyziku pred Ferovým výplodom.

Ďalší aspekt fyziky, ktorý Rosenberga zaujíma je entropia a druhý termodynamický zákon. Podľa Rosenberga tento je dôvodom asymetrie fyzikálneho času. K entropii sa ešte vrátim pri recenzii 12. a 13. kapitoly Jaynesovej knihy. V kontexte tohoto článku je však relevantnejšia Pearlova diskusia štatistického času. Z pohľadu kauzálnej inferencie platí pre časovú orientáciu nasledovné:

V prípade časovej postupnosti vieme, že budúce udalosti nemôžu mať vplyv na minulé udalosti. V tomto prípade sú všetky minulé udalosti potenciálnou príčinou pre všetky budúce udalosti. Pearlova definícia potenciálnej príčiny umožňuje formalizovať koncept štatistického času. Tento je určený kauzálnym zoradením premenných v grafickom modeli. Takýchto zoradení je v každom grafe viacej. Pearl vyjadril domnienku, že aspoň jeden zo štatistických časov bude zodpovedať tomu fyzikálnemu. Pearl však zároveň ukazuje že koncept času závisí od reprezentácie premenných a ku každej reprezentácii je možné nájsť reprezentáciu, v ktorej funguje kauzalita opačne – z budúcnosti do minulosti. Otázku definície času, tak možno zredukovať na otázku definície problému.

To znamená aj že asymetriu času nemožno zdôvodniť 2. termodynamickým zákonom a Pearl zdôrazňuje “consistent agreement between physical and statistical times is a by product of the human choice of linguistic primitives and not a feature of physical reality.” Racionálny bayesián však znovu nemá problém. Otázku správnych lingvistických jednotiek – t.j. správnej reprezentácie problému možno zahrnúť do inferencie ako neznámy parameter a následne určiť orientáciu štatistického času a pýtať sa či je konzistentný s fyzikálnym časom. V niektorých prípadoch môže štatistický čas bežať opačným smerom ako ten fyzikálny.

Je koncepcia štatistického času relevantná pre Rosenbergovu diskusiu? Rosenberg sám poznamenáva, že 2. termodynamický zákon nemusí dočasne platiť v určitých výsekoch reality – napríklad v tých kde sa vyskytujú biologické organizmy. 2. termodynamický zákon platí z pohľadu celého uzatvoreného vesmíru. Podobne, ak je stav každej častice známy tak nemá zmysel rozmýšľať nad kauzalitou. Každý minulý a budúci stav je jednoznačne daný znalosťou toho súčasného. Ak však prejdeme od znalosti celého vesmíru k analýze jeho určitého výseku – a toto je scenár ktorý je relevantný pre ľudí, scientistov a vedcov, tak je kauzálna analýza dôležitým nástrojom pre extrahovanie pravidelnosti a vzorcov z pozorovaní. Kauzálna analýza zároveň poskytuje to čomu sa Rosenberg chce vyvarovať – príbehy. Najdôležitejšou súčasťou kauzálnych vedomostí je znalosť výsledku manipulácii na fungovanie systému. Kauzálne vedomosti tak možno sformulovať ako príbehy typu “ak spravíš X tak sa stane Y”. Rosenberg sám používa tieto kauzálne príbehy, keď vysvetluje entropiu (“ak zatlačíš hlavu pumpičky pri fúkaní bicykla, stúpne entropia častíc vzduchu vnútri pumpy”). Rosenberg zároveň poznamenáva, že ide len o didaktické pomôcky, ktoré musíme používať aby sme ukojili náš zvrátene iracionálny mozog v snahe vôbec sprostredkovať informáciu. Vďaka Pearlovi a jeho kolegom informatikom dnes vieme, že inferencia kauzality nie je výplodom nejakého mozgu, ale optimálnou stratégiou pre racionálneho aktéra ako extrahovať a uložiť informácie o pravidelnostiach v okolitom prostredí. To platí aj o inferencii vo fyzike. Fyzikálne zákony sú nezávislé od kauzálnej interpretácie len v prípade znalosti stavu celého vesmíru. V prípade, že nás zaujíma fungovanie výseku vesmíru, a toto je scenár ktorý zaujíma aj fyzikov v 99.9% prípadov, nadobúdajú fyzikálne zákony dôležitú kauzálny interpretáciu. Na ilustráciu znova poslúži Ohmov zákon:

Ohmov zákon: I=V/R, kde I je prúd, V napätie a R vyjadruje odpor vodiča. Ohmov zákon možno interpretovať kauzálne – pridaním napätia spôsobíme vyšší prietok elektrického prúdu vodičom. V tomto zmysle možno 1/R interpretovať ako konštantný koeficient . Z pohľadu fyziky nie je problém prehodiť členy z ľavej na pravú stranu a naopak. Napríklad môžeme získať R= V/I. Z pohľadu kauzálnej interpretácie je však takáto úprava neprípustná. Rovnica by vyjadrovala, že pridaním prúdu (pri konštantnom napätí) môžeme zmeniť odpor vodiča, čo je zjavne nezmysel. Čiže aj keď fyzici manipulujú rovnice, nie všetky výsledné formulácie sú si rovné. Nie všetky sú kauzálne interpretovateľné.

Na príklade vidieť, že kauzálna interpretácia je kľúčovou súčasťou Ohmovho zákona nie nejakým dôsledkom laikovej neschopnosti, zákon správne interpretovať. Tým pádom nemôžeme súhlasiť s Rosenbergovým tvrdením, že jediným zdrojom asymetrie v fyzike je termodynamický zákon, ktorý ukazuje len jedným smerom. Tento záver je prípustný len pre pozorovateľa ktorý pozná detailný stav celého vesmíru. Pre pozorovateľa s obmedzenými znalosťami je otázka orientácie štatistického času súčasťou inferencie. Táto zároveň určí asymetriu získaných zákonov a dodá im správnu kauzálnu interpretáciu ktorú možno vyjadriť vo forme príbehov o manipulácii príčin vedúcich k určitým výsledkom.

Rosenbergova interpretácia fyzika hrá len úlohu prostredníka, ktorý mu umožní odmietnúť existenciu cieľov a teleologických príčin v biológii a psychológii. Podobne ako sme rozobrali fyziku z pohľadu racionálneho aktéra môžeme rozobrať aj Rosenbergovu diskusiu sémantiky, plánov, cieľov alebo intencionality. Sémantickú analýzu možno vnímať ako rozšírenie tej kauzálnej. V tomto prípade ešte formalizmy nie sú tak ďaleko ako v prípade kauzality, ale Bischofova sémantika nám postačí na to aby sme lokalizovali Rosenbergove argumentačné chyby. Rosenberg argumentuje tým, že myšlienky nemôžu byť o niečom, keďže každý význam potrebuje niekoho kto by ho interpretoval: “The point is that a red octagon or any other clump of matter—ink marks on paper or pixels on a screen—is about something else only because it has been interpreted by someone to be about it.” Červený osemuholník je dopravná značka s významom zastaviť preto, lebo ju ľudia takto interpretujú. Čo však v prípade človeka ktorý myslí na Paríž? Sú jeho myšlienky o Paríži? Môžu byť signály v jeho mozgu o Paríži? Môžu byť vôbec signály v mozgu o niečom?

If the Paris neurons are about Paris the same way a red octagon is about stopping, then there has to be something in the brain that interprets the Paris neurons as being about Paris. After all, that’s how the stop sign is about stopping. It gets interpreted by us in a certain way. The difference is that in the case of the Paris neurons, the interpreter can only be another part of the brain.

Tým sme si však situáciu iba skomplikovali. “We started out trying to explain one case of neurons being about something—Paris. Now we have two cases of neurons being about things—about Paris and about the Paris neurons.” Z pohľadu Bischofovej sémantiky však žiadny problém nevzniká. V prípade neurónov na ich interpretáciu dohliada evolúcia. Neuróny v mozgu opice, ktoré nie sú o nebezpečí, keď opica stretne hada – sú mŕtve neuróny. V mozgu teda môžu byť neuróny ktoré interpretujú aktivitu neurónov v iných oblastiach bez toho aby musela existovať nejaká iná oblasť ktorá by ich interpretačnú aktivitu interpretovala. Finálny význam získavajú signály neurónov prostredníctvom správania ktoré produkujú a ktoré prirodzená selekcia posudzuje. No počkať, evolúcia a význam? Rosenberg hneď ťahá svoj argumentum ad bosonum:

Physics has ruled out the existence of clumps of matter of the required sort. There are just fermions and bosons and combinations of them. None of that stuff is just, all by itself, about any other stuff. There is nothing in the whole universe—including, of course, all the neurons in your brain—that just by its nature or composition can do this job of being about some other clump of matter.

To je samozrejme správne pozorovanie, avšak platí znova len v prípade pozorovateľa, ktorý pozná stav všetkých častíc v celom vesmíre. Ak pracujeme s výsekmi vesmíru, tak sémantika hrá dôležitú inferenčnú úlohu. V predchádzajúcom príspevku som spomínal systém, ktorý vyvinuli Nguyen et al. (2005). Odstavec sa oplatí odcitovať v plnej dĺžke:

Nguyen (Nguyen et al. 2005) s kolegami sa snažili naučiť stroj predpovedať správanie ľudí v kuchyni. Vstupnými dátami pre ich stroj bola pozícia na ploche kuchyne rozdelenej do 6×4 buniek v závislosti od času. Systém sa naučil zhrnúť postupnosť určitých pozícii do opakujúcich sa trajektórii. Napr. pohyb od chladničky ku stolu, alebo pohyb od dverí ku chladničke. Na vyššej úrovni sa naučil systém zhrnúť trajektórie do vzorcov správania, napr. naobedovať sa alebo dať si snack. Stroj hierarchicky postuloval vyššie entity, ktoré mu pomohli zhrnúť, popísať a predpovedať následnosť pozorovaných fenoménov (pozície osoby). Stroj by sa teoreticky zaobišiel aj bez týchto vyšších teoretických entít. Vskutku každý hierarchický model je možné preložiť do komplexného jednoduchého plochého modelu. Parametre tohoto modelu je však ťažšie naučiť sa ako pri tom hierarchickom. Sémantika nám umožňuje zhrnúť správanie a obsah signálov pomocou komplexnejších entít – ich významov. V zásade by sme mohli popísať svet aj pomocou fermiónov a bozónov. Je však jednoduchšie a rýchlejšie popísať svet ak postulujeme ďalšie entity, ktoré popisujú vlastnosti na rozličných úrovniach. Takto je to sa atómami, molekulami, bunkami, organizmami. Sémantika umožňuje vytvárať podobné koncepty, akurát jej základnou črtou je, že elementárne časti, ktoré zahŕňa a popisuje sa nerozprestierajú na priestorovej osy (ako atómy v rámci jednej molekuly), ale na tej časovej (predchádzajúce správanie, budúce správanie).

Kritickým pozorovaním pre nás je, že uvedený hierarchický model sa učí lepšie a rýchlejšie ako ekvivalentný plochý model. Možno namietnuť, že túto preferenciu pre jednoduchší hierarchický model vytvárajú len komputačné nároky, ktoré sú však z pohľadu správneho popisu vesmíru irelevantné. Ak nevieme presne nasimulovať počasie, to neznamená, že počasie je nedeterministická záhada a prútikarstvo je efektívna metóda. Sémantika je však viac než len jednoduchá a rýchla inferencia. Nguyen et al. (2005) ukázali že jednoduchší model lepšie predpovedá stavy systému než plochý komplexnejší model. Toto pozorovanie platí všeobecnejšie. Model na úrovni pozorovaných jednotiek – na úrovni bozónov a fermiónov, na úrovni vzruchujúcich neurónov, na úrovni správania môže poskytnúť horšie predpovede ako model postulujúci ciele. Je to  dané tým, že jednoduchší model bude mať v zásade silnejší bias ako ten komplexný. Bias je v rámci štatistiky technický termín diskutovaný v kontraste so šumom v dátach (bias-variance tradeoff). Modely so silnejším biasom budú schopné zachytiť a modelovať menej variability v doterajších pozorovaniach. Zároveň však poskytnú lepšie zovšeobecnenie pre budúce prípady ako model, ktorý zachytil viacej variability v tréningovej vzorke avšak vystavil sa nebezpečenstvu Overfitting fenoménu. Samozrejme, zároveň musí bias korešpondovať so vzormi správania vyskytujúcimi sa v prírode. Teleologický bias je zrejme optimálny pre popis biologických systémov. Všeobecný dôkaz tohoto tvrdenia zatiaľ nemáme avšak práce informatikov ako u Nguyen et al. (2005) alebo rozšírenosť komputačných modelov v neurovedách a kognitívnych vedách postulúcich vyššie sémantické jednotky ukazujú týmto smerom.

Facit je, že teleologický bias podobne ako kauzálna analýza umožňuje vyextrahovať z pozorovaní správania konštantné vzorce, ktoré lepšie umožnia predpovedať správanie. Tento bias lepšie umožňuje oddeliť šum (zakopnutie aktéra pri pohybe k cieľu) od relevantných údajov (zmena smeru pohybu k inému cieľu ) ako by to dokázal komplexný model manimalizujúci odchýlku medzi predpoveďami a  pozorovaniam na úrovni bozónov/neurónov/správania. Podobne ako kauzálna analýza aj sémantická analýza funguje na výsekoch vesmíru a v rámci celého vesmíru nemá zmysel. Z tohoto dôvodu musíme pri výsekoch vesmíru uvažovať nad šumom. Šum nám ako koncept umožňuje zachytiť vonkajšie vplyvy na správanie systému, ktoré nechceme a väčšinou ani nemôžeme modelovať. V rámci znalosti stavu celého vesmíru žiadny šum neexistuje.

Nezávisle od vyššie uvedeného argumentu môžeme použiť aj samotnú jednoduchosť ako argument pre použitie teleologickej analýzy. Treba si uvedomiť, že Rosenberg musí súhlasiť s jednoduchosťou ako relevantným argumentom ak chce zdôvodniť existenciu bozónov. V časticovej fyzike sú dáta dané zopár tisíckami pozorovaní zrážok a rozpadu atómov. Ak vyžadujeme zachovanie určitých kvantít v zrážkach možno tieto redukovať na ca. 210 elementárnych zrážok. Pomocou ďalších kritérii uprednostňujúcich jednoduchosť sa dopracujeme k ca. 170 časticiam a k ich rozdeleniu na bozóny a fermióny. Rosenberg má v zásade dve možnosti. Odmietnuť jednoduchosť ako relevantné kritérium. Tým pádom musí Rosenberg argumentovať proti existencii bozónov a fermiónov a napomenúť fyzikov aby nesklesli k zvodom svojho iracionálneho mozgu vidieť vzory a entity v zrážkach atómov. Namiesto toho nech pri modelovaní pekne pracujú s tabuľkou par tisíc zrážok. Fyzikalizmus možno aplikovať ad absurdum a pýtať sa prečo by práve pozorovania zrážok vo fyzike mali tvoriť relevantné informácie o fungovaní univerza na mikro úrovni. Pointa je v tom, že bez nejakého konceptu jednoduchosti sa indukcia nemôže odraziť od zeme a takýto dôsledne aplikovaný fyzikalizmus kolabuje do agnostizmu. Ak naopak Rosenberg akceptuje jednoduchosť ako relevantný princíp, otvára nám cestu ako prepašovať do vedy teleologickú analýzu. V porovnaní s redukciou správania ziliónov bozónov, biliónov neurónov alebo milión možných vzorcov správania na zopár túžieb a cieľov aktéra vyzerá redukcia tisíciek zrážok na dve stovky častíc ako totálny inferenčný luxus.

Rosenberg využíva svoje závery o neexistencii cieľov, plánov a intencionality, aby ukázal, že ľudské myslenie, ktoré s týmito konceptami manipuluje je iracionálne a pomýlené. Vyššie sme videli, že kauzálna a teleologická analýza je racionálna a v tomto zmysle aj veridikálna. To samozrejme nemusí ešte platiť o kauzálnych a teleologických analýzach, ktoré ľudia rutinne robia. Formalizácia kauzality a sémantiky okrem toho, že vedcom umožní spoľahlivo pripisovať signálom ich kauzálny/teleologický význam, umožní zistiť nakoľko inferencie u ľudí zodpovedajú vedeckým štandardom.  Toto je otázka na kognitívne vedy. Súčasná evidencia ukazuje, že inferencie kauzality (Gopnik et al., 2004; Griffiths & Tenenbaum, 2005) a intencionality (Baker et al., 2009; Baker et al., 2011) u ľudí sú veľmi podobné bayesiánskym racionálnym modelom. Podobný výskumný program možno rozvinúť okolo ďalších konceptov, ktoré podľa Rosenberga neexistujú ako je koncept ja, reflektívne myslenie alebo plánovanie. Tu je však výskum zatiaľ len v začiatkoch.

Momentálne to teda vyzerá tak, že žiadne ilúzie sa nekonajú. Práve naopak vedci sa snažia zistiť ako ľudské “ilúzie” intencionality a kauzality formalizovať a aby ich mohli naprogramovať u robotov.  Ľudské vnímanie kauzality a intencionality môže samozrejme zlyhať. Tieto zlyhania môžu mať viaceré zdroje. V zásade každý probabilistický inferenčný model v určitom momente poskytne nesprávne predpovede. To môže byť prípad listu točiaceho sa vo vetre po nepravdepodobnej trajektórii tak že ho nesprávne vnímame ako aktéra. Ďalším zdrojom môže byť prirodzený výskyt komplexné dynamických fenoménov, ktorých správanie nie je možné zredukovať pomocou kauzálneho alebo teleologického modelu. Sem možno zaradiť predpovede počasia u ľudí, ktorí nemajú k dispozícii modernú meteorológiu. Zatiaľčo počasie prestalo byť v súčasnosti vďaka meteorológii oblasťou kde nesprávne kauzálne a intencionálne myslenie prekvitá, objavili sa iné systémy s ktorými si ľudia vedia ťažko poradiť. Sem patrí ekonómia, politika alebo dejiny všeobecne. Rosenberg okrem toho, že vyznačuje zlyhania ľudí je pesimistický ohľadom vedeckého pokroku v týchto oblastiach. Táto pozícia je ďalším z tých prípadov, kde Rosenberg vykresľuje poloprázdny pohár. Rosenberg argumentuje, že dejiny sa nesú v znamení kultúrnej evolúcie, ktorú vníma ako darwinistický proces. Podľa Rosenberga však jeho veľkú časť tvoria “preteky v zbrojení”. Jednou vlastnosťou týchto pretekov je že zvýrazňujú a znásobujú vplyv mutácii. Keďže mutácie sú náhodné a kultúrna evolúcia je veľmi rýchla a rapídna jej dejiny budu tvoriť mnohé krátke explózie pretekov v zbrojení. Čoho sa však bude týkať ďalší pretek nie je možné zistiť, keďže mutácie sú náhodné a tým pádom vývoj dejín nemožno dlhodobo predpovedať a nemá zmysel ani účel. Myslím, že v tomto prípade nám Rosenberg znovu ukázal len polovicu pohára. Preteky v zbrojení tvorí explodujúca spätná väzba a je typická pre systém parazita a hosťa. Príroda však pozná aj konzervujúce spätné väzby. Tieto sú typické pri synergické vzťahy, napr. medzi človekom a baktériami v jeho čreve. Tieto systémy utlmujú náhodné vplyvy mutácii. A nielen mutácii. Synergické systémy utlmujú vplyv náhodných vonkajších javov na správanie systému. Synergické systémy môžeme hľadať aj v dejinách a umožnia nám predpovede v dlhšom horizonte. Synergickým efektom môže byť napríklad globalizácia a medzinárodná ekonomická závislosť, ktorá robí perspektívu vojny v Európe nepravdepodobnou.

Môžeme zhrnúť, že Rosenberg sa ohľadom iluzórnosti všetkej kauzality, cieľov a účelov mýli. Bolo by ľahké skočiť k záveru, že kauzalita, ciele a účely existujú ako fenomény reality. Toto je koniec-koncov pozícia ktorú zastáva väčšina naturalistov. Ako som varoval na začiatku, musíme sa ubrániť ontologickej formulácii otázok a odpovedí. Snáď najbližšie sa k tomu dostal asi Dennett, keď zvažoval v kontexte intencionality nasledujúci myšlienkový experiment:

Suppose some beings of vastly superior intelligence—from Mars, let us say—were to descend upon us, and suppose that we were to them as simple thermostats are to clever engineers. Suppose, that is, that they did not need the intentional stance—or even the design stance—to predict our behavior in all its detail. They can be supposed to be Laplacean super-physicists, capable of comprehending the activity on Wall Street, for instance, at the microphysical level. Where we see brokers and buildings and sell orders and bids, they see vast congeries of subatomic particles milling about—and they are such good physicists that they can predict days in advance what ink marks will appear each day on the paper tape labeled “Closing Dow Jones Industrial Average.” They can predict the individual behaviors of all the various moving bodies they observe without ever treating any of them as intentional systems. Would we be right then to say that from their point of view we really were not believers at all (any more than a simple thermostat is)? (Dennet, 1989; s. 25)

A Dennett (ibid.) dospieva k názoru, že: “Our imagined Martians might be able to predict the future of the human race by Laplacean methods, but if they did not also see us as intentional systems, they would be missing something perfectly objective: the patterns in human behavior that are describable from the intentional stance, and only from that stance, and that support generalizations and predictions.”  Toto by bola pekná štartovacia pozícia pre ujasnenie si toho čím tieto vzorce správania sú a aké zovšeobecnenia a predpovede umožňujú. Týmto by sa diskusia posunula k zaujímavým a relevantným epistemologickým otázka. Napríklad je možné že Rosenberg by vedel príjsť s argumentom pre koncept jednoduchosti, ktorý by bol použiteľný vo fyzike avšak neumožnil by postulovať príčiny, cieľe, účely a plány. Namiesto toho skĺzava diskusiu, vrátane tej Dennettovej do hašterenia nakoľko sú dodatočné fakty sprostredkované teleologickou analýzou objektívne, skutočné, kde sú fyzicky lokalizovateľné… Treba dodať, že tieto diskusie nie sú dôsledkom neadekvátnosti filozofických metód. Podobné diskusie nájdeme aj vo fyzike v kontexte emergencie. Sú emergujúce javy viac než len suma častí? Ktoré aspekty emergentných fenoménov tvoria tie dodatočné javy? Kedy a kde v priebehu sebaorganizácie mikročastíc na makrosystém tieto dodatočné fenomény emergujú? Prínosom Rosenbergovej pozície je že dospieva k diametrálne odlišným postrehom a väčšina jeho kolegov, ktorí si tieto otázky kladú. Myslím, že Rosenbergova AGR je tak výbornou ilustráciou nezmyselnosti ontologickej formulácie otázok. Ak možno z podobných východzích naturalistických pozícii dospieť k diametrálne odlišným záverom ohľadom určitej otázky tak je táto otázka zle formulovaná. Jej riešenie zrejme zahŕňa ďalšie implicitné, skryté predpoklady. Tieto predpoklady sú epistemologického charakteru a bez ich ujasnenia sa diskusia nepohne vpred.

Osobne veľmi pochybujem, že k tomuto ujasneniu dôjde. Naturalistická filozofia bude namiesto toho ešte horlivejšie pokračovať v produkovaní neplodných diskusii o nesprávne formulovaných večných otázkach a ich vzťahu k vede. Obzvlášť teraz keď Rosenberg prihodil svoju scientistickú rozbušku k dielu. Prvé plody možno vidieť tu alebo tu. My ostatní môžeme na najbližších 10 rokov vyškrtnúť naturalistickú filozofiu z programu a uprieť zrak na informatiku, neurovedy a kognitívne vedy, kde správne formulované epistemologické otázky nachádzajú odpovede. Naturalistických filozofov zrejme po určitom čase irelevantné a nikam nevedúce argumentovanie unudí a ich prístup prejde ďalšou fázou naturalizácie, keď filozofi zbadajú, že informatika a kognitívne vedy ich otázky vyriešili alebo preukázali ich nezmyselnosť.

Toto by boli pekné záverečné slová, toto ale ešte nie je koniec. Rosenbergova kniha nekončí pri faktickom konštatovaní neexistencie príčin a účelov. Rosenbergova kniha je myslená aj ako návod pre ateistov ako reflektovať svoj každodenný život. Rosenberg ukazuje, že väčšina faktických údajov sú z pohľadu správania irelevantné, keďže správanie je väčšinou determinované všetkým iným len nie vedomou reflexiou ako nám naša intuícia hovorí. Naopak vedomá reflexia len usporiada naše konanie do konzistentného príbehu. Nekonzistentné správanie je zabudnuté a v pamäti nahradené tým konzistentným. Tento obraz fungovania ľudskej reflexie nie je nový a čitateľom sledujúcim výskum v sociálnej psychológii by mal byť dobre známy. Tento obraz môžeme domyslieť do dôsledkov. Rosenberg tak spravil pre prípad morálneho rozhodovania a od nihilizmu (žiadne príčiny, účely = žiadne zdôvodnenie morálky nie je možné, anything goes) k milému nihilizmus (zdôvodnenie a reflexia morálky je pre správanie irelevantná, správanie je dané kmeňovou morálkou, ktorá bola naprogramovaná evolúciou). Myslím, že môžeme zájsť ešte ďalej a dospieť k milému scientizmu a milému naturalizmu. Nielenže odpovede na otázku morálky nemajú reálny vplyv na správanie ľudí ale ani odpovede na všetky večné otázky nemajú reálny vplyv na správanie ľudí. Naturalisti by mohli namietnuť, že aj keď z pohľadu vedy sú večné otázky neproduktívne sformulované, tieto formulácie zaujímajú bežných ľudí pri rozhodnutiach a preto ich treba vyriešiť. Ak však odpovede na večné otázky nemajú na správanie vplyv, aké sú reálne ciele Rosenbergovho scientizmu, naturalistickej filozofie a naturalizmu všeobecne? Ich diskusie sú irelevantné pre vedu, lebo si nekladú správne otázky. Ich diskusie sú irelevantné pre správanie ľudí, lebo ho nemajú ako ovplyvniť. Z naturalistickej filozofie tak po vzore teológie ostáva intelektuálna zábavka pre skupinku akademikov a zopár vzdelaných connoisseurov z radov laickej verejnosti. Toto je skutočný koniec!

Literatúra

Baker, C. L., Saxe, R., & Tenenbaum, J. B. (2009). Action understanding as inverse planning. Cognition 113.3: 329-349.

Baker, C. L., Saxe, R. R., & Tenenbaum, J. B. (2011). Bayesian theory of mind: Modeling joint belief-desire attribution. In Proceedings of the thirty-second annual conference of the cognitive science society.

Dennett, D. C. (1989). The intentional stance. MIT press.

Dennett, D. C. (1996). Darwin’s Dangerous Idea: Evolution and the Meanins of Life. Simon and Schuster.

Gopnik, A., Glymour, C., Sobel, D. M., Schulz, L. E., Kushnir, T., & Danks, D. (2004). A theory of causal learning in children: Causal maps and Bayes nets.

Griffiths, T. L., & Tenenbaum, J. B. (2005). Structure and strength in causal induction. Cognitive psychology, 51(4), 334-384.

Nguyen, D. Phung, S. Venkatesh, and H. Bui (2005), Learning and detecting activities from movement trajectories using the hierarchical hidden Markov models, CVPR.

Rosenberg, A. (2011). The Atheist’s Guide to Reality: Enjoying Life Without Illusions. WW Norton & Company.