Většina toho, co se o AI dnes dočteme, je jen dobře připravené PR

Většina takzvaných přelomových novinek z oblasti AI je pouze dobře odvedené PR. Česko a Evropa technologicky zaostává za USA, chybí nám strategie i větší podpora vlád, říká Tomáš Mikolov. Ten přes svůj mladý věk (36) na sebe svým objevem na poli vektorové reprezentace slov a přelomovou prací v oblasti rekurentních neuronových sítí (byl první kdo je dokázal úspěšně trénovat) již stačil upozornit světovou špičku mezi výzkumníky umělé inteligence. Tomáše jsme odchytili na  Human-Level AI Conference, největší světové konferenci na téma obecné umělé inteligence, která proběhla koncem srpna v Praze.

Když se řekne Human level AI, představíte si spíše marketingový buzzword, nebo reálný cíl, kterého je možné dosáhnout?

Vlastně si představím obě možnosti. To, co dnes různé firmy a startupy označují pojmem umělá inteligence, je ve skutečnosti v lepším případě pouze aplikace statistických modelů na problémy, kde je k dispozici velké množství dat. V horším případě pak opravdu jen buzzword, který má přilákat pozornost a investice. Nicméně já a mnozí další vědci věří, že v budoucnu budeme schopni vytvořit algoritmy, které budou inteligentní podobným způsobem, jako jsme my.

Jak byste Human level AI vůbec definoval?

Počítačový algoritmus, nebo chcete-li program, který je schopen vykonávat podobné typy intelektuálních úloh jako my lidé. Tedy například přečíst článek na Wikipedii a být schopen odpovědět na související otázky. Schopnost napsat nový (podobný) článek. Dále programování, konverzace nebo nezávisle prováděný výzkum. Od Human-level AI bychom měli očekávat minimálně to, co můžeme očekávat od jiného člověka, se kterým komunikujeme jen elektronicky.

Co pro vás znamená inteligence v tom tradičním lidském pojetí?  

Schopnost učit se rychle vyřešit nové problémy, adaptovat se na měnící se podmínky.

Proč se vlastně do výzkumu umělé inteligence dnes pouštějí také komerční společnosti, jako je Facebook nebo Google? Výzkum je musí stát obrovské množství peněz, za kterými není vidět okamžitá návratnost. Co si od toho slibují?

Těch důvodů je více. Aplikované strojové učení v posledních letech výrazně zpřesnilo a zrychlilo některé důležité aplikace, jako je například vyhledávaní informací na internetu, automatický překlad, rozpoznávaní řeči, filtrování spamu a tak dále. Je tedy logické, že investovat do tohoto oboru je velmi důležité. Společnost, která v tomto směru zaspí, riskuje, že bude nahrazena konkurencí, která vyvine lepší služby. Pokud jde o dlouhodobý výzkum v oblasti AI – tedy vymyslet to, co ještě neexistuje, jako je ta Human-level AI – tam se zase přepokládá, že nové objevy mohou umožnit vznik nových typů aplikací, které v současnosti vytvořit nelze. Ačkoliv k přelomovým objevům dochází velmi zřídka, komerční potenciál je obrovský.

Souvisí tento zájem také s tím, že právě tyto společnosti mají přístup k obrovskému množství velkých dat? A dá se vůbec dnes zkoumat umělá inteligence bez nich?

Tady bych zase rozlišil dva rozdílné směry, které se dnes běžně označují jako AI. Za prvé je zde aplikované strojové učení, což jsou v podstatě velké statistické modely. Zde opravdu závisí na množství dat, které právě Facebook, Google, Amazon, Apple, Microsoft a další mají k dispozici. Výsledné modely ale opravdu nejsou inteligentní, jen vám umožní například zjistit, co se daný uživatel na internetu snaží najít, jaké příspěvky ho zajímají a toto mu zobrazit. Druhý směr, ta obecná umělá inteligence, je zatím natolik otevřený problém, že vůbec nevíme, jestli existující datasety, které máme, jsou vůbec relevantní. Můj názor je, že AI dnes může zkoumat a vyvinout prakticky kdokoliv.

Jak vlastně výzkum v takových firmách probíhá? Věnujete se svobodně primárnímu výzkumu nebo je všechno podřízeno nějakému jasně danému cíli. Spolupracujete na vývoji konkrétních produktů?

Ve Facebooku máme dva spolupracující týmy, ve kterých pracují vědci, kteří jsou často celosvětově nejlepší ve svém oboru. Aplikovaný tým AML (Applied Machine Learning) má za cíl zpřístupnit ty nejlepší existující techniky strojového učení ostatním týmům ve Facebooku. Protože se v našem oboru publikují tisíce vědeckých článků ročně, je to spousta práce. Druhý tým, ve kterém pracuji já, se jmenuje Facebook AI Research (FAIR), naším cílem je naopak vymyslet nové převratné přístupy, které překonají existující techniky. Máme hodně úspěchů ve vylepšování například existujících modelů pro rozpoznávání objektu v obraze nebo klasifikaci textu. Všechny své výsledky publikujeme, často včetně open-source projektu, takže výsledky naší práce jsou využitelné kýmkoliv dalším, včetně univerzit, startupů i dalších firem. Ve FAIR máme naprostou svobodu, takže někteří z nás přemýšlí i nad takovými problémy, jako je Human-level AI.

Připomíná dnes výzkum umělé inteligence spíše závody ve zbrojení nebo je to kolaborativní proces, ve kterém všem jde o jeden společný cíl?

Asi to budou spíše ty závody ve zbrojení. Bohužel, většina novinek, které se o AI v poslední době dočteme, jsou jen dobře připravené PR projekty, které mají veřejnost přesvědčit, jak úžasný a přelomový je nějaký nový objev. Za takovými zprávami jsou často celé týmy profesionálních marketingových specialistů, grafiků a spisovatelů.

Jak jen na tom na poli AI Česká republika, myslíte si, že je v Česku dostatečná podpora základního výzkumu?

Těžko soudit jaká je situace nyní. Když jsem v roce 2012 končil v Česku doktorské studium, tak jsem určitě neměl dojem, že by podpora základního výzkumu byla kdovíjak skvělá. Většina projektů na univerzitě se zaměřovala na aplikovaný výzkum.

Jak jsme na tom naopak s komerčními projekty, můžeme se někdy v dohledné budoucnosti stát AI velmocí?

Možné je vše, ale z mého pohledu není náhodou, že valná většina velkých technologických firem je z USA. Myslím, že Evropa potřebuje lepší strategii pro budoucí rozvoj.

Jaké odvětví dnes z AI nejvíce profituje? Je to medicína, finanční trhy, průmysl nebo nějaká úplně jiná oblast?

Určitě největší užitek ze strojového učení mají technologické firmy, jako je právě Facebook a Google. Nicméně i ty další oblasti, které zmiňujete, se zásadním způsobem posouvají dopředu. Zdravotnictví je jen jedna z oblastí, kde se předpovídá, že by mohlo dojít k velkým zlepšením právě chytrou aplikací toho, co už známe – tj. využitím statistických modelů natrénovaných na velkém množstvích dat.

O vás by se dalo laicky říci, že učíte stroje lépe rozumět lidskému jazyku. Vaší specializací je vektorová reprezentace slov. Můžete ve stručnosti popsat, jak funguje a proč se od ní tolik očekává?

Tato technologie dnes už dávno vylepšuje množství reálných aplikací, ať už jde o vyhledáváni na internetu nebo například strojový překlad. Jako příklad mohu uvést Google Translate, který se nedávno skokově zlepšil použitím neuronových sítí i pro překlady do češtiny – to bylo výsledkem spolupráce mezi týmy Google Brain a Google Translate, kterou jsem inicioval již v roce 2012. Popsat stručně, jak tyto modely fungují, není úplně snadné, můžete se ale podívat na moji dizertační práci nebo projekty word2vec a fastText, které jsem vedl.

Pokud bych měl vše krátce shrnout, tak vektorové reprezentace slov umožní převést slovo v textu na vícerozměrný vektor (soubor čísel), který má zajímavé vlastnosti. Podobná slova mají podobné reprezentace, a různé směry v těchto vektorových prostorech mají sémantické a syntaktické interpretace. Můžete tedy najít směr, ve kterém se transformují slovesa z přítomného času do času minulého. Mnoho vědců bylo překvapených, když jsem ukázal, že s těmito vektory lze sestavovat i rovnice – například výsledek ‚king – man + woman‘ je ‚queen‘.

Nedokazuje objev vektorové reprezentace slov tak trochu oprávněnost Chomského (údajně vyvrácené) teorie o univerzální gramatice? Narážím teď na možnost realizovat automatické překlady i bez znalosti daného jazyka.

Chomsky předpokládal, že schopnost lidí porozumět jazyku je částečně vrozená, zakódovaná na úrovni genu. Tvrdil, že všechny světové jazyky tím pádem sdílí nějakou společnou strukturu, onu univerzální gramatiku. Tato teorie nebyla nikdy prokázaná (ale ani úspěšně vyvrácena). Můj vlastní názor je, že lidé mají vrozenou schopnost naučit se používat jazyk, ale ne až na tak vysoké úrovni, jako předpokládal Chomsky. Převládající názor mezi vědci, kteří se zabývají strojovým učením, pak je, že Chomsky neměl pravdu – pro mnohé aplikace, jako je například ten automatický překlad, můžeme využít statistické techniky, které se vše učí z příkladu a nevyžadují žádnou univerzální gramatiku sestavenou lidskými experty.

Když se rozhlédnu kolem sebe, tak většina aplikací takzvané umělé inteligence představuje hlavně nějakou formu statistických modelů a jednoúčelových algoritmů. Existuje ale už dnes nějaká umělá inteligence, která jde za tyto hranice, případně kdy se jí nejpravděpodobněji dočkáme?

Toto je právě cílem vědců pracujících na směrech označovaných jako General AI, Human-level AI, strong AI atd. V současné době žádný dobrý funkční prototyp nemáme. Kdy se dočkáme nějakého reálného pokroku, je otázka, optimisté si myslí, že snad během několika let. Jistě si ale předtím vyslechneme mnoho PR prohlášení, kdy nám budou jednoúčelové algoritmy prezentovány jako obecná umělá inteligence.

Vy osobně jste příznivcem spíše obecné nebo specializované AI?

Já jsem příznivcem obou přístupů. Co se tyče narrow-AI, jako je právě vylepšení rozpoznávaní řeči či automatického překladu, dokázal jsem ve své práci výrazně zpřesnit existující modely a takto vylepšit aplikace používané lidmi po celém světě. Můj sen byl ale vždy vytvořit inteligentní počítač, který nebude třeba programovat, se kterým se domluvíme přirozeným jazykem a který nám pomůže vyřešit problémy, které si ještě ani neumíme představit. Lidská inteligence má mnoho zásadních omezení. Vždyť například naše pracovní paměť může v jednu dobu udržet jen zhruba šest předmětů. Bylo by úžasné sledovat inteligenci, která by tyto hranice překonala a zároveň nám pomáhala řešit naše problémy.

Tomáš Mikolov aktuálně pátým rokem působí v hlavním výzkumném týmu Facebooku v jeho centrále v Silicon Valley. Předtím pracoval na podobné pozici v prestižním týmu v Google – Google Brain. Jeho specializací je strojové učení a zpracování jazyka. Je také ideovým autorem programových knihoven word2vec a fastText, které jsou dnes masivně využívány většinou velkých hráčů na poli AI. Jeho expertíza je zejména v oboru vektorové reprezentace slov, ta umožňuje například zlepšovat automatické překlady, úspěšně bojovat proti spamu nebo rozpoznávat řeč. Pomocí této techniky lze dokonce s úspěchem realizovat překlady bez znalosti daného jazyka.

Newsletter