Nir Diamant je specialistou na budování AI systémů, iniciátorem Open Source Knowledge Hub a zakladatelem DiamantAI Community, kde se diskutují aktuální souvislosti s využitím AI. Jeho příběh, jak se stroje prostřednictvím jazyka učí (A Story of How Machines Learn to Think Through Language), je skvělým výkladem fungování velkých jazykových modelů (LLM) [1]. Zaujal mě natolik, že jsem se rozhodl vám ho zjednodušeně zprostředkovat. Výsledek vznikl s pomocí mého oblíbeného nástroje NotebookLM.
Učení AI má určité podobnosti s učením člověka, hlavní rozdíl spočívá v tom, že u člověka je to proces biologický, kdežto u AI matematický, uplatňovaný v obrovském měřítku v prostředí neuronových sítí, které disponují v současnosti u největších modelů řádově trilionem (paměťových) buněk.
Modely LLM mají základní strukturu, která je specificky navržena pro zpracování předem vložených slov v sekvenci a porozumění jejich vztahům. Na počátku začíná jazykový model jako chaos, v němž jsou miliardy parametrů (jež si lze představit jako „páčky a přepínače“) nastavené na náhodné hodnoty.
Netrénovaný chaotický model produkuje jedině nesmysly, protože nemá (na rozdíl od novorozence) žádné naučené vzorce. Dejme tomu, že od něj budeme chtít doplnit větu „The cat … on the …“ Bez nastavených vztahů klidně vybere slova zcela náhodně. Má-li však k dispozici dostatečné množství existujících textů, může vyhodnotit, jak moc velká je v této větě pravděpodobnost výskytu vhodných slov. Změřit tuto pravděpodobnost lze u každého slova, které je k dispozici. Pak už může v několika cyklech (Attempt) stanovit, které má tu nejvyšší, a predikovat tak, jak by mohla daná věta vypadat (od červeného rámečku přes žlutý k zelenému).
Je to tak, že model AI se učí prostřednictvím predikce, ne interakcí jako lidé. Opakovaně a v obrovském měřítku žádáme, aby uhodl chybějící části textů, ale tím to teprve začíná. Model se zároveň snaží stále sofistikovanějšími způsoby pochopit kontext. Když například uvidí „Kočka si sedla na rohožku, protože...“, neučí se jen o kočkách a rohožkách – učí se též o kauzalitě, vztahu mezi únavou a sezením a o typickém chování zvířat. To vše vyplývá z jednoduchého aktu předvídání, jaká slova by měla následovat.
Postupně se tak model učí porozumět jazyku. Na začátku hádá špatně, ale každou chybu lze přesně změřit. Zde nastupují matematické nástroje, které pomáhají určit, jak moc se model mýlil a jak moc jednotlivé parametry k chybě přispěly. Představte si, že hodnotíte postup žáka při řešení matematického problému – můžete sledovat každý krok zpět, abyste přesně zjistili, kde došlo k chybě. To je to, co tento proces dělá – ale pro miliardy malých rozhodnutí, která udělala AI na cestě. Díky tomu lze příště dospět k lepším výsledkům.
Je důležité, jak je tréninkový proces (jeho algoritmus) strukturován a jaká data mají modely k dispozici. K tréningu je využíváno obrovské množství pokud možno co nejkvalitnějších textových dat (knihy, webové stránky, vědecké práce atd.). Vhodné jsou texty různých kontextů, od různých autorů a o různých tématech. Model se učí od jednodušších vzorů k složitějším, podobně jako člověk – od rozpoznávání statistických vztahů mezi slovy k porozumění gramatice (ne pomocí pravidel, ale z mnoha příkladů) až k pochopení významu v různých formulacích.
Nakonec se začne objevovat něco, co se nápadně podobá sémantickému porozumění. Model začíná chápat, že „kočka sedí na rohožce“ a „micka odpočívá na koberci“ má podobný význam, i když jsou použita jiná slova. Učí se, že „banka“ datová znamená něco jiného než „banka“ jako instituce.
Současné modely mohou řešit matematické úlohy, rozumět analogiím, logicky uvažovat, být kreativní a překládat jazyky. Začínají projevovat schopnosti, které nebyly explicitně trénovány, ale vyplývají ze složitých interakcí naučených vzorů.
Učit se pouze hledáním vzorů, má své limity. AI může být oklamána při existenci podobných, ale ne stejných vzorů majících odlišný význam. Tak vznikají tzv. halucinace – generování sice věrohodných, ale nesprávných informací. Pozor na to, že modely jsou sebejisté, i když se mýlí, protože jsou trénovány na generování vysoce pravděpodobných odpovědí, nikoli na vyjádření nejistoty.
Klíčová je správně nastavená rychlost učení – příliš rychlé učení je nedokonalé (model si zapamatuje jen poslední informaci), příliš pomalé může trvat příliš dlouho, a je proto neefektivní a drahé. Trénink velkých modelů je v každém případě nákladný, vyžaduje obrovské výpočetní kapacity (tisíce počítačů v datových centrech) a mnoho vody na chlazení.
To, co vzejde z procesu učení AI, není lidská mysl. Je to něco úplně jiného. Je to nebývale sofistikovaný systém porovnávání vzorů. Když funguje dobře, výsledky jsou ohromující – jako bychom vytvořili skutečnou umělou inteligenci. Když selže, musíme si připomenout, že na pozadí je ohromně sofistikovaný statistický model, který hraje neuvěřitelně složitou hru.
To je síla i omezení moderní AI. Dokáže se zapojit do zdánlivě inteligentní konverzace ne proto, že myslí jako my, ale proto, že se naučila rozpoznávat a vytvářet vzorce v lidské řeči s mimořádnou přesností. Dokáže odpovídat na otázky ne proto, že věci zná, ale protože dokáže rozpoznat vzorce, které spojují otázky s vhodnými odpověďmi.
Současný vývoj ovlivňující budoucnost AI řeší fascinující otázky:
Tvorba modelů, které se učí efektivněji a vyžadují méně dat a výpočetního výkonu. To má zásadní význam pro usnadnění budování AI modelů mimo největší (a nejbohatší) korporace.
Zajištění etického chování a eliminace škodlivých předsudků.
Lepší pochopení kauzality a logiky.
Zdokonalení tréninkových metod za účelem zlepšení spolehlivosti a přesnosti výsledků.
V jádru zůstane v nejbližší budoucnosti základní proces stejný – učit se předpovědí, upravovat pomocí zpětné vazby, opakovat miliardkrát. Proces učení AI není magie, ale komplexní kombinace matematiky, statistiky a výpočetního výkonu. Jde o ambiciózní projekt, který nám umožňuje nejen vytvářet výkonné AI systémy, ale také získávat hlubší vhled do samotné podstaty učení, porozumění a inteligence. Cesta od náhodného šumu k porozumění je důkazem síly strojového učení a sofistikovanosti lidského jazyka.
Všechny články jsou publikovány pod licencí Creative Commons BY-NC-ND.
Článek nebyl prozatím komentován.
Pro vložení komentáře je nutné se nejprve přihlásit.
Článek není zařazen do žádného seriálu.
Národní pedagogický institut České republiky © 2025