Konekcionistický model vhľadu

V minulých článkoch som sa zaoberal výskumom vhľadu. Spomenul som aj niektoré teórie napríklad Ohlssonovu teóriu reprezentačnej zmeny. Étosom tohoto blogu je, že teoretizovanie v psychológii sa musí zmeniť a pokročiť od telenovel o zásobníkoch s reprezentáciami a ich informačnej promiskuite k formálnym matematickým modelom, ktorých komputačné implementácie simulujú dáta. Aj v prípade vhľadu nás v konečnom dôsledku zaujímajú komputačné modely. Zatiaľčo modelári v kognitívnych vedách sa výdatne zaoberajú riešením problémov, fenomén vhľadu ostal bokom. Za to zrejme vďačí svojej zdanlivej iracionalite a rázovitej dynamike. Rolu zrejme hrajú aj v minulých článkoch spomenuté ťažkosti s vytvorením spoľahlivých a ekologicky valídnych experimentov a získavaním dát. V posledných troch rokoch sa však objavili hneď tri nové modely, ktoré si postupne na tomto blogu prejdem.

Prvým je konekcionistický model od Helieho a Suna (2010). Tento vychádza z delenia reprezentácii na explicitné (vedomé) a implicitné (podvedomé). Pri riešení problémov explicitné a implicitné mechanizmy prispievajú k evolúcii reprezentácii tohoto systému až kým nedospejú k riešeniu. Pri problémoch vyžadujúcich vhľad dôjde k vyčerpaniu potenciálnych explicitných stratégii. Implicitné mechanizmy však fungujú naďalej aj počas fázy bezradnosti a po presiahnutí určitej hranice aktivujú explicitné mechanizmy. Riešenie, ktoré objavili implicitné mechanizmy sa stane vedomím a dochádza k vhľadu. Rázové zjavenie riešenia tak prebieha len na explicitnej úrovni, na implicitnej úrovni je hľadanie riešenia kontinuálne. Autori postulujú, že explicitné mechanizmy majú formu logických pravidiel. Implicitné mechanizmy sú naopak založené na podobnosti a asociácii rôznych reprezentácii v pamäti. Obidva mechanizmy pracujú paralelne a z časti aj nezávisle, čo môže viesť ku konfliktom alebo duplicite. Väčšinou však spolu interagujú, takže výsledky spracovávania informácii na jednej úrovni ovplyvňujú výsledky na druhej úrovni. Ak aktivácia týchto výsledkov na explicitnej úrovni prekročí určitú hranicu, premietne sa to do behaviorálneho rozhodnutia – reprezentovaná akcia je aplikovaná. Ak táto hranica prekročená nie je, proces riešenia problému pokračuje ďalej.

Z formálneho hľadiska vyzerá model nasledovne. Explicitný model je neurónová sieť pozostávajúca z rady vstupných a výstupných uzlov. Vstupné uzly väčšinou reprezentujú východiskovú problémovú situáciu. Výstupné uzly reprezentujú odpoveď. Tieto reprezentácie sú lokalistické. Napríklad ak mám obrázok na ktorom je kôň, traktor a tráva, tak nezapnem súčasne tri uzly pre koňa, traktor a trávu ale mám jeden uzol, ktorý reprezentuje celú situáciu a kôň + traktor + tráva, ktorý zapnem. Ostatné uzly reprezentujú všetky ostatné situácie (traktor+tráva, kôň+traktor, kôn sám, nič …). Zapnúť znamená, že daný uzol má hodnotu 1 a ak je vypnutý tak je na nule. V zásade sa hodnoty uzlov pohybujú v rozmedzí [0,1]. Uzly explicitného modelu majú logické spojenia, ktorých sila môže byť tiež 1 (spojenie existuje) alebo 0 (spojenie neexistuje). Dajme tomu, že úlohou probanda je zistiť, či na obrázku je zviera. Výstupné uzly sú zviera a žiadne zviera. Spojenia medzi vstupnými a výstupnými uzlami vyjadrujú vedomosti dotyčnej osoby. Keďže dotyčný vie, že kôň je zviera tak existujú spojenia zo všetkých vstupných uzlov ktoré zahŕňajú koňa k výstupnému uzlu zviera. Ak je teda aktivovaný konský uzol tak tento aktivuje aj ten zvierací. Formálne y_j = \sum_i v_{ij} x_i, kde y_j sú výstupné a x_i vstupné uzly a v_{ij} vyjadruje silu spojenia. Vo vyššie uvedenom príklade sumácia nemá moc veľký zmysel keďže pri lokalistickej reprezentácii, vždy len jeden vstupný uzol je aktivovaný a spojenie je logické (teda má hodnotu 1 alebo 0). Systém však prechádza viacerými iteráciami, počas ktorých sa aktivácia explicitných uzlov môže meniť.

Okrem explicitných uzlov používa systém aj implicitné uzly. Implicitná úroveň zodpovedá štruktúrou tej explicitnej. Obsahuje vstupné a výstupné uzly, ktoré sú navzájom spojené. Uzly na implicitnej úrovni sú aktivované neurónmi na explicitnej úrovni: z_j = \sum_i e_{ij} x_i a z_j = \sum_i f_{ij} y_i, pričom množiny uzlov z_k z_n sa neprelínajú. Explicitné lokalistické reprezentácie sú teda preložené do distribuovaných reprezentácii na implicitnej úrovni. Situácia kôň + traktor + tráva môže na implicitnej úrovni aktivovať viacej uzlov a naopak ten istý uzol môže byť aktivovaný rozličnými situáciami, pritom nie je dôležité ako konkrétne sú explicitné a implicitné uzly cez e_{ij} f_{ij} pospájané. Vskutku, na začiatku simulácie sú zvolené tieto spojenia náhodne. To isté platí pre spojenia medzi implicitnými uzlami, pričom tu sa nerozlišuje medzi vstupnými a výstupnými uzlami ale v zásade môže byť spojené všetko so všetkým: z^{t+1}_j= \sum_i f(w_{ij} z^t_i) . V tejto formulke sa na rozdiel od všetkých ostatných spojení vyskytuje funkcia f, ktorá prekladá kontinuálne reálne hodnoty do rozmedzia [-1,1] a zaručuje nelinearitu implicitného systému. Implicitná úroveň je teda tvorená nelineárnym dynamickým systémom, ktorý je aktivovaný explicitnými reprezentáciami. Následne implicitná sieť prejde sériou iterácii a až kým nekonverguje (= hodnoty uzlov sa prestanú meniť). Potom sú výsledné aktivácie propagované na vyššiu úroveň. Vyššia úroveň prešla len jednou iteráciou a to spomínaným aplikovaním logických pravidiel y_j = \sum_i v_{ij} x_i. Implicitné a explicitné aktivácie sú následne kombinované na explicitnej úrovni, čo dáva možnosť implicitným podvedomým procesom ovplyvniť explicitné vedomé procesy a rozhodovanie. Formálne vyzerá táto kombinácia nasledovne x^{t+1}_j =max( x^t_j,\sum_i e_{ij} z_i) a y^{t+1}_j =max( y^t_j,\sum_i e_{ij} z_i). Ak y^{t+1}_j prekročí pre niektoré j prahovú hodnotu \psi tak zodpovedajúca akcia je aplikovaná. Ak sa tak nestane, celý proces pokračuje odznova. Explicitné uzly aktivujú implicitné, tieto prejdú iteratívnym procesom a výsledné implicitné aktivácie sú zaslané naspäť na explicitnú úroveň, kde sú kombinované s explicitnými výsledkami a porovnané s prahovou hodnotou. Týmto spôsobom je možné simulovať odpovede probandov, ale aj rýchlosť ich odpovedí.

Systém sa takisto učí, takže spojenia môžu podliehať zmenám a môžeme posúdiť či a za ako dlho sa pôvodné explicitné vedomosti zmenili na nové poznatky. Hodnoty spojení sú na začiatku vygenerované náhodne a potom sa menia pomocou hebbiánskeho učenia:E=XZ, F=YZ, V=XY (algoritmus pre transfomáciu spojení medzi implicitnými uzlami je trochu komplikovanejší). Explicitné spojenia V tvoria väčšinou výnimku, a ich počiatočné hodnoty nie sú vygenerované náhodne, ale zodpovedajú predpokladaným vedomostiam. Pri vhľade sú pôvodné vedomosti + reprezentácie problému nevhodné a musia byť transformované. Táto transformácia prebieha na implicitnej úrovni, ktorá v určitom okamihu pozmení explicitné reprezentácie, riešenie sa stane vedomím, čo proband vníma ako vhľad.

Autori aplikovali model pri dátach z dvoch štúdii inkubácie a (pre nás relevantné) pri dátach z dvoch štúdii vhľadu. Podľa autorov obstál model v týchto porovnaniach dobre a umožňuje tak zhrnúť viaceré fenomény pod jeden spoločný model. Tento model je súčasťou Sunovej kognitívnej architektúry CLARION. V tejto štúdii však bola relevantná len určitá časť tejto architektúry. Celý systém je omnoho zložitejší a snaží sa popísať v ucelenom modeli rozličné fenomény naprieč kognitívnymi doménami. Kognitívne architektúry ako CLARION alebo Andersonov ACT-R sa v tomto zmysle snažia ponúknuť alternatívu k výskumu kognície pomocou binárnych otázok a odpovedí zameriavajúcich sa na úzko ohraničené výskumné domény.

Myslím, že toľko by stačilo k popisu modelu. Nasledujú moje postrehy. Priznám sa, že som bol (a stále som) z článku Helieho a Suna dosť zmätený. Zdá sa, že článok sa dlhú dobu poohrial v šuplíku, alebo preliezol viacerými kolami peer-review než ho Perspectives akceptovali. V podstate všetky referované zdroje sú z pred roku 2005. Štúdie, ktorých dáta autori simulujú sú zo začiatku 90. rokov. Článok obsahuje značné množstvo teórie a diskusie rôznych teoretických pozícii (často historických pozícii, ktoré dnes už nikto nezastáva), ktoré sú pre model irelevantné a štúdia by sa zaobišla bez nich. Perspectives je teoretický časopis a autori zrejme museli pridať teoretické časti, aby mohol byť publikovaný. Najhoršiu časť tvoria simulácie a porovnania modelu s dátami. Po viacnásobnom prečítaní a snahách o benevolentnú interpretáciu som dospel k názoru, že simulácie sú odpad a príkladom ako sa modeli nemajú testovať. Myslím, že z tohoto dôvodu môže byť zaujímavé si simulácie rozobrať podrobnejšie na tomto blogu. Mozgostroje nechcú len sprostredkovať pozitívne príklady modelovania v kognitívnych vedách, ale aj prípady nesprávnej aplikácie. Na rozdiel od príbehových teórii, umožňujú formálne modely (aj tie zlé) identifikovať a jednoznačne popísať tieto problémy.

Hlavným problémom simulácii je, že autori nemajú dáta. Namiesto toho pribrali výsledky referované v publikovaných štúdiách, teda poznajú len spriemerované hodnoty. Problémom je, že stredové hodnoty poskytujú len minimum informácie na základe, ktorej modely možno otestovať.

Uvediem príklad. Vo štvrtej simulácii išlo o dáta z nasledujúceho experimentu. Probandi dostali nasledujúci problém. Numizmatik príde do obchodu so starožitnosťami a je mu ponúknutá elegantná bronzová minca  s hlavou rímskeho cisára na jednej strane a so signatúrou 544 b.c. na druhej strane. Numizmatik namiesto toho aby mincu kúpil zavolá políciu. Prečo? Probandi dostali najprv 2 minúty aby riešili problém. Po dvoch minútach jedna skupina riešila nesúvisiaci problém, zatiaľčo druhá skupina musela verbalizovať svoju stratégiu riešenia problému. Táto fáza trvala 90 sekúnd. Nakoniec mali obe skupiny 4 minúty aby problém vyriešili. Výsledkom bol signifikantný rozdiel medzi skupinami pričom 36 % v skupine verbalizujúcich a 46 % v kontrolnej skupine daný problém vyriešilo.

Ako vstupy pre model slúžili štyri aspekty situácie. Materiál mince (dobrý/zlý), dátum mince (dobrý/zlý), odtlačok na hlave mince (dobrý/zlý) a rozhodnutie numizmatika (kúpiť/nekúpiť). Výstupmi bolo osem interpretácii danej situácie: materiál dobrý+dátum dobrý + odtlačok dobrý, materiál dobrý+dátum dobrý + odtlačok zlý a.t.ď. (rozhodnutie numizmatika nebolo zahrnuté na strane výstupov, keďže toto závisí od ostatných troch atribútov, t.j. numizmatik kúpi mincu ak sú všetky tri aspekty v poriadku, inak nie). Na začiatku simulovaného experimentu boli aktivované vstupy MD,DD,OD a RN, ktoré reprezentovali počiatočne vnímaný rozpor v správaní. Úlohou modelu bolo prísť s odpoveďou MD+DZ+OD na strane výstupov. Model bol simulovaný v dvoch podmienkach. Skupina, ktorá verbalizovala bola simulovaná pomocou modelu, ktorý 2+4 minúty hladal riešenie. 90 sekúnd verbalizácie podľa autorov blokovalo explicitné aj implicitné spracovanie a teda k žiadnemu pokroku počas tejto fázy nedošlo. U skupiny, riešiacej nesúvisiacu úlohu, podľa autorov prebiehalo implicitné učenie a tak aj model po 2 Minútach prešiel 1,5 minútovou fázou, kde prebiehalo učenie na implicitnej úrovni. Po tejto fáze nasledovali zvyšné 4 minúty. Autori merali proporcie modelov, ktoré danú úlohu vyriešili. Percentá zodpovedali, výsledkom u ľudí.

Daný model má už na prvý pohľad takú hračkársku príchuť. Množina 8 riešení, ktorú tvoria kombinácie troch aspektov situácie asi ťažko zodpovedá množine riešení, ktorú skúmajú ľudia. Táto množina je u ľudí o mnoho väčšia, potenciálne nekonečná, v čom práve spočíva náročnosť daného problému. Model sa môže dopracovať k riešeniu cez náhodné hádanie odpovedí. V priemere potrebuje 8 pokusov, aby uhádol správnu odpoveď. Zabrániť mu v tom môže fixácia na určité riešenie – teda situácia, keď model stále produkuje identické riešenia.

Ako som spomenul, autori nemajú dáta a preto si musia vystačiť s dvoma hodnotami. Problém je, že ich model má vyše 10 voľných parametrov, ktoré môžu ľubovolne nastaviť tak, aby model vykázal požadované proporcie. Problémom je obzvlášť, keď prispôsobujú parametre medzi skupinami. Napr. parameter ovplyvňujúci fixáciu odpovedí bol u skupiny počas riešenia nesúvisiacej úlohy upravený na inú hodnotu ako počas iných fáz. Takisto samotný dizajn simulácie, v ktorom je umožnené jednej skupine sa učiť a druhej nie, je podozrivý. Prečo by malo byť u verbalizujúcej skupiny implicitné riešenie problému zablokované? Autori zabudovali do simulácii príliš veľa neoverených apriórnych postulátov. Tým vzniká podozrenie, že sa tak stalo post-hoc a postuláty a vybrané hodnoty parametrov slúžia len na to, aby model umožnil simulovať dané hodnoty. Pri desiatke parametrov a len dvoch stupňoch voľnosti variácie v dáta je výpovedná hodnota simulácii nulová. Bizarné pôsobí snaha aplikovať štatistické testy na simulované dáta a porovnať signifikantné výsledky simulácie so signifikantnými výsledkami v experimentoch. Pri simuláciach použili autori 1000 opakovaní (čím získali super signifikantné výsledky). Probandov bolo samozrejme menej, čím sú experimenty neporovnateľné. Samotná variabilita medzi probandami je zrejme odlišná. Model pravdepodobne vykazuje nízke efekty a teda bola potrebný vyšší počet opakovaní.

Ako by vyzerali správne simulácie? Potrebujeme dáta, ktoré poskytujú minimálne toľko stupňov voľnosti ako má náš model parametrov, ideálne však mnohonásobne viac. Model neoverujeme tým, že rátame štatistiky ako u probandov a následne kvalitatívne porovnáme signifikantné efekty. Namiesto toho meriame kvantitatívne fit modelu (na to existujú rôzne štatistiky a metódu, ktoré na tomto mieste nechce rozoberať). Fit zohľadňuje aj schopnosť modelu popísať interindividuálnu variabilitu. Fit by takisto mal zohľadniť počet voľných parametrov modelu a tým umožniť porovnať modely s odlišný počtom parametrov. Porovnávanie modelov je nevyhnutné. Fit (, ktorý sa udáva v ťažko interpretovateľných jednotkách) jedného modelu je sám o sebe bezvýznamný. Zaujímavý je len v porovnaní s iným modelom. Štúdia Helieho a Suna zlyháva vo všetkých týchto bodoch. Pritom uvedený štandard modelovania je dnes už zabehaný. Dôvody tohoto štandardu by mali byť jasné. Snaží sa zabrániť propagácii modelov, ktoré sú jedna ku jednej napasované na dáta a nič nevysvetľujú ani dáta nijak nekomprimujú. Poskytujú akurát ich popis zaodetí do pozlátky matematických hieroglyfov. O tomto práve zlé modelovanie je a treba vedieť tú pozlátku prekuknúť. Žiaľ mnoho výskumníkov získa na základe takýchto modelov dojem, že modelovanie je len o tejto pozlátke a nič viac nevie ponúknuť. To je obrovská škoda. Myslím, že modelári musia byť viacej asertívni a rázne sa vyhradiť voči mizerným modelom, tak ako som to spravil ja v tomto článku.

Hélie, S. & Sun, R. (2010). Incubation, insight, and creative problem solving: A unified theory and a connectionist model. Psychological Review, 117, 994-1024.

Pridaj komentár

Zadajte svoje údaje, alebo kliknite na ikonu pre prihlásenie:

WordPress.com Logo

Na komentovanie používate váš WordPress.com účet. Log Out / Zmeniť )

Twitter picture

Na komentovanie používate váš Twitter účet. Log Out / Zmeniť )

Facebook photo

Na komentovanie používate váš Facebook účet. Log Out / Zmeniť )

Google+ photo

Na komentovanie používate váš Google+ účet. Log Out / Zmeniť )

Connecting to %s