Domů > Spomocník > Základní vzdělávání > Mohla by generativní AI nahradit Wikipedii?
Odborný článek

Mohla by generativní AI nahradit Wikipedii?

2. 8. 2023 Základní vzdělávání Spomocník
Autor
Jaroslav Mašek
Tento článek je součastí seriálu: Umělá inteligence

Anotace

Význam Wikipedie v éře generativní AI a vize důvěryhodné budoucnosti podle Seleny Deckelmann.
 

„Pokud by existovala generativní umělá inteligence, která by sama dokázala napsat veškeré informace obsažené ve Wikipedii, byla by stejná jako dnešní Wikipedie?“ ptá se v úvodu svého článku s názvem Význam Wikipedie v éře generativní AI Selena Deckelmann. Její odpověď je prostá a jednoznačná: „Ne, nebyla.“ A důvodů má hned několik. [1]

Kdo je Selena Deckelmann

Vystudovala informatiku na Oregonské univerzitě a téměř 10 let působila ve společnosti Firefox, kde od roku 2020 zastávala pozici viceprezidentky.

Od srpna 2022 je hlavní produktovou a technologickou ředitelkou nadace Wikimedia Foundation, neziskové organizace, jejíž cílem je podpora a rozvoj otevřených wikiprojektů, například právě Wikipedie, aby veškerý jejich obsah zůstal pro uživatele zdarma. [1][2][3]

Význam Wikipedie ve vztahu k AI

A po úvodní otázce se snaží svým čtenářům připomenout, v čem tkví jedinečnost Wikipedie i to, jaký význam má ve vztahu ke generativním AI modelům:

„Proces otevřeného vytváření vědomostí, jejich sdílení a vylepšování, veřejně a za pomoci stovek tisíc dobrovolníků, za 20 let zásadně formoval Wikipedii a mnoho dalších Wikimedia projektů. Wikipedie obsahuje důvěryhodné, spolehlivé a podložené informace, protože je vytvářena, diskutována a kurátorována lidmi. Je také založena na otevřeném, nekomerčním modelu, což znamená, že je dostupná a sdílená zdarma a vždy bude. V době, kdy je internet zaplaven strojově generovaným obsahem, to znamená, že se Wikipedie stává ještě hodnotnější.

V posledních šesti měsících se veřejnost seznámila s desítkami velkých jazykových modelů (anglicky Language Large Models, zkráceně a dále jen LLM), trénovaných na obrovských datasetech, které dokážou číst, shrnout a generovat text. Wikipedie je jedním z největších otevřených korpusů informací na internetu, s obsahem ve více než 300 jazykových verzích. Dosud každý velký jazykový model byl trénován na obsahu Wikipedie a téměř vždy tento obsah představoval největší zdroj trénovacích dat v těchto datasetech.“ [1]

Nedostatky generativní AI při psaní Wikipedie

A nezapomíná též zmínit situace, kdy se lidé pokoušeli pomocí generativní AI psát Wikipedii, a popisuje, jakým problémům přitom čelili. Pojďme si výčet nedostatků, spojených s generováním textů pomocí LLM, které uvádí, stručně shrnout:

  • Výstup z LLM momentálně neobsahuje proces ověřování fakt.
  • LLM nemohou použít informace, na kterých nebyly natrénovány (např. z knih, které nejsou dostupné online, nebo z předinternetových výzkumů), což může vést k zesilování existujících nerovností a předsudků v mnoha oblastech.
  • LLM trpí tzv. „kolapsem modelu“, kdy zapomínají věci, které jednou „věděly“.

Jak sama dodává: „Aby byly LLM dobré a zlepšovaly se, budou potřebovat stálý zdroj originálního obsahu, který je psán lidmi, což činí Wikipedii a další zdroje generované lidmi ještě cennějšími. Zároveň to znamená, že generativní AI společnosti po celém světě musí přijít na to, jak udržet zdroje originálního lidského obsahu, což je nejkritičtější prvek našeho informačního ekosystému, dlouhodobě udržitelný a rozvíjející se v čase.“ [1]

Důležité principy při použití generativní AI

Selena Deckelmann také poznamenává, že vývoj nástrojů generativní AI, kterému se Wikimedia Foundation věnuje již mnoho let, stojí na totožných principech, jako jsou ty, které jsou uplatňované na Wikipedii:

„Strojově generovaný obsah a nástroje strojového učení nejsou pro Wikipedii a další projekty Wikimedia žádnou novinkou. Ve Wikimedia Foundation jsme vyvinuli nástroje strojového učení a umělé inteligence na základě těch samých principů, které udělaly z Wikipedie tak užitečný zdroj pro mnoho lidí: zaměřením se na lidské moderování obsahu a lidské řízení. Nadále experimentujeme s novými způsoby, jak uspokojit znalostní potřeby lidí zodpovědným způsobem, včetně použití platforem generativní umělé inteligence, s cílem dostat lidský přínos a reciprocitu na první místo. Editoři Wikipedie mají kontrolu nad veškerým strojově generovaným obsahem – upravují, zlepšují a kontrolují práci vykonanou AI – a vytvářejí politiky a struktury pro řízení nástrojů strojového učení, které se používají ke generování obsahu pro Wikipedii.“ [1]

Současné a nově vznikající velké jazykové modely (LLM) by podle ní měly přemýšlet nad tím, jak budou podporovat lidi v následujících třech klíčových oblastech:

Udržitelnost. Generativní AI technologie má potenciál negativně ovlivnit lidskou motivaci k vytváření obsahu. LLM by se měly starat o rozšiřování a podporu lidského zapojení v rozvoji a tvorbě znalostí. Nikdy by neměly lidské tvorbě znalostí bránit nebo ji nahrazovat. Ustavičná podpora lidí při sdílení jejich znalostí je nejen v souladu se strategickým posláním hnutí Wikimedia, bude též nezbytná při dalším rozšiřování našeho celkového informačního ekosystému, tvořící aktuální trénovací data, na která LLM spoléhá. [1]

Spravedlnost. LLM mohou rozšiřovat dostupnost informací a nabízet inovativní způsoby k jejich dodání lidem hledajícím znalosti. Aby toho dosáhly, musí mít tyto platformy zabudovány kontrolní a vyvážené mechanismy, které nezachovávají informační předsudky, nezvětšují vědomostní rozdíly, nadále nevymazávají tradičně opomíjené dějiny a hlediska nebo nepřispívají k porušování lidských práv. LLM by též měly zvážit, jak identifikovat, řešit a opravovat předsudky ve trénovacích datech, které mohou vést k nepřesným a značně nespravedlivým výsledkům. [1]

Transparentnost. LLM a rozhraní k nim by měly lidem umožnit pochopit původ zdroje, ověřit jej a opravit výstupy modelu. Zvýšená transparentnost v tom, jak jsou výstupy generovány, nám může pomoci pochopit a poté zmírnit škodlivé systémové předsudky. Tím, že uživatelům těchto systémů umožníme posoudit příčiny a následky předsudků, které mohou být přítomny ve trénovacích datech nebo ve výstupech, mohou se tvůrci a uživatelé podílet na pochopení a uvážlivém použití těchto nástrojů. [1]

Mohla by generativní AI nahradit Wikipedii?

„Přispívání od lidí patří k neodmyslitelné součásti internetu. Lidé jsou hnacím motorem růstu a rozvoje online prostoru, ze kterého vytvořili neuvěřitelné místo pro učení, byznys a navazování kontaktů s ostatními," doplňuje závěrem Selena Deckelmann a pokládá zásadní otázku: „Mohla by generativní AI nahradit Wikipedii?“

A stejně jako na tu úvodní dává i tentokrát zcela jasnou odpověď:
„Mohla by to zkusit, ale výsledkem by byla náhrada, kterou skutečně nikdo nechce. Nová technologie není nevyhnutelná. Místo toho je na nás všech, abychom si vybrali, co je nejdůležitější. Můžeme upřednostňovat lidské vědomosti a přispívání znalostmi pro svět, udržitelně, spravedlivě a transparentně tak, aby byly klíčovým cílem generativních AI systémů, a ne něčím dodatečným. To by mohlo pomoci zmírnit narůstající dezinformace a halucinace LLM; zajistit, aby byla lidská kreativita uznána pro vědění, které vytváří; a co je nejdůležitější, postarat se o to, aby jak LLM, tak i lidé nadále a dlouhodobě spoléhali na aktuální, rozvíjející se a důvěryhodný informační ekosystém.“ [1]

O co bychom přišli

Jednu věc ale Selena Deckelmann ve svém článku nezmínila: o co by wikipedisté v roli editorů přišli, kdyby místo nich články na Wikipedii generovala umělá inteligence.

Není to ani proces hledání nezávislých, netriviálních, věrohodných zdrojů pro konkrétní články, ani vytváření vhodné struktury v nich (v obou případech by AI jednou mohla velmi dobře posloužit).

Přišli by o něco jiného: o proces tvorby encyklopedických textů, který je tak naplňuje a dává jim smysl, že se Wikipedii věnují zadarmo ve svém volném čase. Jde o stejný kreativní proces, kteří zažívají všichni tvůrci obsahu. Proces, který je čas od času trochu bolestivý, ale který vás dokáže naplnit pocitem uspokojení, protože víte a někde uvnitř cítíte, že se vám to povedlo a že na sebe můžete být právem hrdí. Kdo někdy nějaký kreativní obsah nejen na Wikipedii vytvořil, asi ví, co mám na mysli.

 

Literatura a použité zdroje

[1] – DECKELMANN, Selena. Wikipedia’s value in the age of generative AI. 2023. [cit. 2023-7-15]. Dostupný z WWW: [https://wikimediafoundation.org/news/2023/07/12/wikipedias-value-in-the-age-of-generative-ai/].
[2] – Nadace Wikimedia. 2004. [cit. 2023-7-18]. Dostupný z WWW: [https://cs.wikipedia.org/wiki/Nadace_Wikimedia].
[3] – Selena Deckelmann, LinkedIn. 2023. [cit. 2023-7-18]. Dostupný z WWW: [https://www.linkedin.com/in/selenadeckelmann/].

Licence

Všechny články jsou publikovány pod licencí Creative Commons BY-NC-ND.

Hodnocení od uživatelů

Článek nebyl prozatím komentován.

Váš komentář

Pro vložení komentáře je nutné se nejprve přihlásit.