Statistics vs. Machine Learning

Strojové učenie (Machine Learning, SU) je časť informatiky, ktorá má ku kognitívnym vedám v súčastnosti najbližšie. SU možno považovať historicky za vetvu umelej inteligencie. Zatiaľčo GOFAI sa sústredila na rigidné programy, ktoré programátor obdaril všetkými ich vedomosťami a schopnosťami, SU aplikácie sa snažia extrahovať vedomosti priamo z dát a prostredia, čo vedie k ich väčšej adaptívnosti a flexibilite. Príkladmi SU sú neurónové siete, support vector machines, a bayesiánske modely. Patria sem však aj genetické a evolučné algoritmy.

Z pohľadu štatistikou je celý rozruch a nadšenie okolo SU nemiestny. Vecne vzaté, SU rieši rovnaké problémy ako štatistici a aj riešenia sú v zásade rovnaké. Ako sa už niektorí komentátori pozastavili, dôsledky môžu byť dosť zvláštne. Napriklad na Stanforde učí Andrew Ng  SU pre informatikov a trio Hastie, Friedman, Tibshirani učia štatistické učenie študentov štatistiky. Témy prednášok sú v zásade tie isté. Líšia sa študenti a ich cieľová kvalifikácia. Takisto je zaujímavé, že síce oba obory hovoria o rovnakých veciach používajú odlišnú terminológiu. Kde SU hovorí o neurónoch, závažiach, učení a zovšeobecnovaní štatistici hovoria o parametroch, optimalizácii a validácii. SU je proste viac sexy a tomu zodpovedá aj kvalita doktorandov,  výška financovania a popularita SU. Tieto rozdiely sa teda týkajú iba kultúry a sociálneho prostredia oboch oborov. To znamená, že štatistici za svojimi kolegami v SU zaostávajú len v schopnosti predať výsledky svojej práce.

Takáto analýza myslím, že trochu moc lichotí štatistikom. Jeden zásadný rozdiel existuje a ten je podľa mňa veľmi dôležitý. Striktne vzaté kvantitatívne metódy sú len formalizáciou a kompletizáciou našich intuícii. SU výskumníci sú ochotní doviesť tento proces formalizácie do dôsledkov. Teoreticky je pre nich možné ľudský faktor úplne vyňať z celého vedeckého procesu. Cieľom je teda postaviť stroj, ktorý vzorkuje realitu, vyhodnocuje dáta a v konečnom dôsledku nám induktívne ponúkne teóriu všetkého. Reálna implementácia takéhoto stroja je science fiction. Ide skôr o ideál postupnej redukcie závislosti stroja od rodičovskej ruky vedca, o ktorú sa SU výskum snaží. Dôležitím prínosom tohoto je prístupu, je že nám umožní rigorózne posúdiť otázky, či je možné zvnútra popísať fungovanie vesmíru a ktoré skupiny strojov, procesov a algoritmov a s akou konvergenciou nám k tomu môžu dopomôcť. Inštrumenty, pre svoju prácu si požičia SU z iných oborou matematiky a informatiky ako sú algoritmika, teória komplexity a teória automatov.

Štatistika sa zaoberá konvergenciou ale iba u analýzy dát. Proces špecifikovania otázky a hypotéz, návrhu experimentu a budovania teórii je vo výsostnej kompetencii výskumníka a žiadny stroj ho nenahradí.  Priznám sa, že mi nie je známy koherentný argument prečo by tomu tak malo byť. (Rád sa ale nechám poučiť v diskusii.) Myslím, že dôvody tohoto pohľadu sú čisto historické. Na prelome začiatku 20. storočia, keď vznikala štatistika ako vedný odbor neexistovali počítače. Experimenty nebolo možné automatizovať pomocou počítačov a štatistické analýzy sa museli počítať ručne. Vedci sa preto snažili vymyslieť pokiaľ možno generickú a logisticky nenákladnú metódu výskumu. Výsledkom bola NHST v štatistike a deduktívny vedecky prístup, o ktorého presadzovanie sa zaslúžil najviac filozof Karl Popper.  Tvorba vedeckých teórii a stanovenie hypotéz sa stalo u Poppera metafyzickou záležitosťou nepodliehajúcou vedeckému aparátu a tobôž simuláciam alebo analýzam pomocou strojov.

Lenže čas sa pohol. Nielenže máme rýchle počítače ale matematici a informatici začali nahlodávať otázky, ktoré predtým patrili do pôsobnosti filozofie. Okrem toho že nám SU umožňuje vyvinúť silné aplikácie pre analýzu dát poskytuje aj odpovede na otázky riešené v rámci epistemológie a teórie vedy. Teória učenia nám umožňuje postaviť stroje, ktoré sa učia ale aj zistiť ako sa optimálne učiť  a teda ako by sa mali optimálne učiť vedci. Štatistika odpovede na tieto otázky neumožňuje. Samotné otázky sú jej cudzie.

Cieľom tohoto príspevku bolo uviesť strojové učenie v kontraste so štatistikou. Čo konkrétne také úžasne SU zjavila v oblastiach epistemológie svetu si nechám na nasledujúce príspevky. Na tomto miesto len spomeniem, že v podstate Popperov deduktívny prístup obrátila na ruby. Je to dedukcia, ktorá sa ukazuje ako nemožná a indukcia je cestou napred. Tí nedočkaví môžu nazrieť do nasledujúcich referencii.

Harman, G., Kulkarni, S. (2012). Reliable Reasoning: Induction and Statistical Learning Theory. MIT Press, Cambridge, MA.

Vapnik, V. (1995). The Nature of Statistical Learning Theory. Springer, NY.

Pridaj komentár

Zadajte svoje údaje, alebo kliknite na ikonu pre prihlásenie:

WordPress.com Logo

Na komentovanie používate váš WordPress.com účet. Log Out / Zmeniť )

Twitter picture

Na komentovanie používate váš Twitter účet. Log Out / Zmeniť )

Facebook photo

Na komentovanie používate váš Facebook účet. Log Out / Zmeniť )

Google+ photo

Na komentovanie používate váš Google+ účet. Log Out / Zmeniť )

Connecting to %s