„Pokud by existovala generativní umělá inteligence, která by sama dokázala napsat veškeré informace obsažené ve Wikipedii, byla by stejná jako dnešní Wikipedie?“ ptá se v úvodu svého článku s názvem Význam Wikipedie v éře generativní AI Selena Deckelmann. Její odpověď je prostá a jednoznačná: „Ne, nebyla.“ A důvodů má hned několik. [1]
Vystudovala informatiku na Oregonské univerzitě a téměř 10 let působila ve společnosti Firefox, kde od roku 2020 zastávala pozici viceprezidentky.
Od srpna 2022 je hlavní produktovou a technologickou ředitelkou nadace Wikimedia Foundation, neziskové organizace, jejíž cílem je podpora a rozvoj otevřených wikiprojektů, například právě Wikipedie, aby veškerý jejich obsah zůstal pro uživatele zdarma. [1][2][3]
A po úvodní otázce se snaží svým čtenářům připomenout, v čem tkví jedinečnost Wikipedie i to, jaký význam má ve vztahu ke generativním AI modelům:
„Proces otevřeného vytváření vědomostí, jejich sdílení a vylepšování, veřejně a za pomoci stovek tisíc dobrovolníků, za 20 let zásadně formoval Wikipedii a mnoho dalších Wikimedia projektů. Wikipedie obsahuje důvěryhodné, spolehlivé a podložené informace, protože je vytvářena, diskutována a kurátorována lidmi. Je také založena na otevřeném, nekomerčním modelu, což znamená, že je dostupná a sdílená zdarma a vždy bude. V době, kdy je internet zaplaven strojově generovaným obsahem, to znamená, že se Wikipedie stává ještě hodnotnější.
V posledních šesti měsících se veřejnost seznámila s desítkami velkých jazykových modelů (anglicky Language Large Models, zkráceně a dále jen LLM), trénovaných na obrovských datasetech, které dokážou číst, shrnout a generovat text. Wikipedie je jedním z největších otevřených korpusů informací na internetu, s obsahem ve více než 300 jazykových verzích. Dosud každý velký jazykový model byl trénován na obsahu Wikipedie a téměř vždy tento obsah představoval největší zdroj trénovacích dat v těchto datasetech.“ [1]
A nezapomíná též zmínit situace, kdy se lidé pokoušeli pomocí generativní AI psát Wikipedii, a popisuje, jakým problémům přitom čelili. Pojďme si výčet nedostatků, spojených s generováním textů pomocí LLM, které uvádí, stručně shrnout:
Jak sama dodává: „Aby byly LLM dobré a zlepšovaly se, budou potřebovat stálý zdroj originálního obsahu, který je psán lidmi, což činí Wikipedii a další zdroje generované lidmi ještě cennějšími. Zároveň to znamená, že generativní AI společnosti po celém světě musí přijít na to, jak udržet zdroje originálního lidského obsahu, což je nejkritičtější prvek našeho informačního ekosystému, dlouhodobě udržitelný a rozvíjející se v čase.“ [1]
Selena Deckelmann také poznamenává, že vývoj nástrojů generativní AI, kterému se Wikimedia Foundation věnuje již mnoho let, stojí na totožných principech, jako jsou ty, které jsou uplatňované na Wikipedii:
„Strojově generovaný obsah a nástroje strojového učení nejsou pro Wikipedii a další projekty Wikimedia žádnou novinkou. Ve Wikimedia Foundation jsme vyvinuli nástroje strojového učení a umělé inteligence na základě těch samých principů, které udělaly z Wikipedie tak užitečný zdroj pro mnoho lidí: zaměřením se na lidské moderování obsahu a lidské řízení. Nadále experimentujeme s novými způsoby, jak uspokojit znalostní potřeby lidí zodpovědným způsobem, včetně použití platforem generativní umělé inteligence, s cílem dostat lidský přínos a reciprocitu na první místo. Editoři Wikipedie mají kontrolu nad veškerým strojově generovaným obsahem – upravují, zlepšují a kontrolují práci vykonanou AI – a vytvářejí politiky a struktury pro řízení nástrojů strojového učení, které se používají ke generování obsahu pro Wikipedii.“ [1]
Současné a nově vznikající velké jazykové modely (LLM) by podle ní měly přemýšlet nad tím, jak budou podporovat lidi v následujících třech klíčových oblastech:
Udržitelnost. Generativní AI technologie má potenciál negativně ovlivnit lidskou motivaci k vytváření obsahu. LLM by se měly starat o rozšiřování a podporu lidského zapojení v rozvoji a tvorbě znalostí. Nikdy by neměly lidské tvorbě znalostí bránit nebo ji nahrazovat. Ustavičná podpora lidí při sdílení jejich znalostí je nejen v souladu se strategickým posláním hnutí Wikimedia, bude též nezbytná při dalším rozšiřování našeho celkového informačního ekosystému, tvořící aktuální trénovací data, na která LLM spoléhá. [1]
Spravedlnost. LLM mohou rozšiřovat dostupnost informací a nabízet inovativní způsoby k jejich dodání lidem hledajícím znalosti. Aby toho dosáhly, musí mít tyto platformy zabudovány kontrolní a vyvážené mechanismy, které nezachovávají informační předsudky, nezvětšují vědomostní rozdíly, nadále nevymazávají tradičně opomíjené dějiny a hlediska nebo nepřispívají k porušování lidských práv. LLM by též měly zvážit, jak identifikovat, řešit a opravovat předsudky ve trénovacích datech, které mohou vést k nepřesným a značně nespravedlivým výsledkům. [1]
Transparentnost. LLM a rozhraní k nim by měly lidem umožnit pochopit původ zdroje, ověřit jej a opravit výstupy modelu. Zvýšená transparentnost v tom, jak jsou výstupy generovány, nám může pomoci pochopit a poté zmírnit škodlivé systémové předsudky. Tím, že uživatelům těchto systémů umožníme posoudit příčiny a následky předsudků, které mohou být přítomny ve trénovacích datech nebo ve výstupech, mohou se tvůrci a uživatelé podílet na pochopení a uvážlivém použití těchto nástrojů. [1]
„Přispívání od lidí patří k neodmyslitelné součásti internetu. Lidé jsou hnacím motorem růstu a rozvoje online prostoru, ze kterého vytvořili neuvěřitelné místo pro učení, byznys a navazování kontaktů s ostatními," doplňuje závěrem Selena Deckelmann a pokládá zásadní otázku: „Mohla by generativní AI nahradit Wikipedii?“
A stejně jako na tu úvodní dává i tentokrát zcela jasnou odpověď:
„Mohla by to zkusit, ale výsledkem by byla náhrada, kterou skutečně nikdo nechce. Nová technologie není nevyhnutelná. Místo toho je na nás všech, abychom si vybrali, co je nejdůležitější. Můžeme upřednostňovat lidské vědomosti a přispívání znalostmi pro svět, udržitelně, spravedlivě a transparentně tak, aby byly klíčovým cílem generativních AI systémů, a ne něčím dodatečným. To by mohlo pomoci zmírnit narůstající dezinformace a halucinace LLM; zajistit, aby byla lidská kreativita uznána pro vědění, které vytváří; a co je nejdůležitější, postarat se o to, aby jak LLM, tak i lidé nadále a dlouhodobě spoléhali na aktuální, rozvíjející se a důvěryhodný informační ekosystém.“ [1]
Jednu věc ale Selena Deckelmann ve svém článku nezmínila: o co by wikipedisté v roli editorů přišli, kdyby místo nich články na Wikipedii generovala umělá inteligence.
Není to ani proces hledání nezávislých, netriviálních, věrohodných zdrojů pro konkrétní články, ani vytváření vhodné struktury v nich (v obou případech by AI jednou mohla velmi dobře posloužit).
Přišli by o něco jiného: o proces tvorby encyklopedických textů, který je tak naplňuje a dává jim smysl, že se Wikipedii věnují zadarmo ve svém volném čase. Jde o stejný kreativní proces, kteří zažívají všichni tvůrci obsahu. Proces, který je čas od času trochu bolestivý, ale který vás dokáže naplnit pocitem uspokojení, protože víte a někde uvnitř cítíte, že se vám to povedlo a že na sebe můžete být právem hrdí. Kdo někdy nějaký kreativní obsah nejen na Wikipedii vytvořil, asi ví, co mám na mysli.
Všechny články jsou publikovány pod licencí Creative Commons BY-NC-ND.
Článek nebyl prozatím komentován.
Pro vložení komentáře je nutné se nejprve přihlásit.
Tento článek je zařazen do seriálu Umělá inteligence.
Ostatní články seriálu: