Student, který vytvořil detektor AI plagiátorství

3. 2. 2023 Základní vzdělávání Spomocník

Autor

Jaroslav Mašek

Zobrazit více

Tento článek je součastí seriálu: Umělá inteligence

Anotace

Příběh o studentovi, který chtěl, aby lidé znali pravdu o původu textů, o tom, zda je napsal člověk, nebo umělá inteligence.

Na Princetonské univerzitě se na začátku prosince nemluvilo o ničem jiném. Generativní jazykový model ChatGPT, který byl spuštěn 30. listopadu, na sebe i na zdejší škole strhl veškerou svou pozornost. Jeho pokročilost uchvátila jak místní učitele, tak studenty. Jednoho však víc než ostatní.

Edward Tian, 22letý student posledního ročníku oboru počítačová věda, si podobně jako mnoho lidí po celém světě, kteří chatbota vyzkoušeli, velmi rychle uvědomil obtížnost v rozeznávání obsahu vygenerovaného umělou inteligencí od toho, za kterým stojí člověk. A tak se rozhodl, že se této výzvě postaví a napíše program, který to rozeznat dokáže.

„Říkal jsem si, proč bych něco takového nemohl vybudovat a zjistit, zda to svět použije.”

GPTZero aneb lidé si zaslouží znát pravdu

Detektor AI textů nakonec vytvořil v průběhu několika dní o zimních prázdninách na konci roku 2022 a nazval jej GPTZero.

„Kolem ChatGPT je tolik hypu. Napsala AI tohle a tamto? My lidé si zasloužíme to vědět!“ publikoval Tian při představení své aplikace GTPZero na svém Twitteru.

GPTZero byl spuštěn 2. ledna a získal si spoustu pozitivní odezvy od těch, kteří jej vyzkoušeli. V prvním týdnu to bylo více jak 30 tisíc lidí. Stal se natolik populární, že platforma, na které byl hostován, spadla a její zdroje musely být provozovatelem navýšeny, aby zvládla požadovaný webový provoz.

Na základě reakcí uživatelů, kteří program v počáteční fázi testovali, Tian uznal, že jeho bot není bezchybný, a všem obratem vzkázal, že na přesnosti a vylepšení svého modelu stále pracuje. Od začátku také deklaroval, že chce aplikaci ponechat navždy volně dostupnou pro všechny. [1]

Jak GPTZero funguje

K určení, zda text napsal bot, používá GPTZero dva indikátory: „složitost“ a „výkyv“. Složitost měří komplikovanost textu; pokud je detektor GPTZero daným textem zmaten, pak je to tím, že tento text vykazuje vysokou složitost, a je tedy pravděpodobnější, že jej napsal člověk. Pokud se text zdá botu povědomý, protože na takových datech byl trénován, stane se méně komplexním, a tím pádem bude pravděpodobněji vygenerován pomocí AI.

Nezávisle na tomto přístupu je tu indikátor výkyvů, který srovnává odchylky ve větách. Lidé mají tendenci psát s většími výkyvy, tj. například používat delší a komplexnější věty současně s těmi kratšími. Věty od AI bývají obvykle mnohem uniformnější. [1]

GPTZero neznamená nulovou toleranci

Tian se též vymezil proti zákazu nástrojů, jako je ChatGPT. Když vzdělávací odbor města New York začal začátkem ledna blokovat přístup k modelu ChatGPT ve školních sítích a zařízeních z obav o jeho negativní dopady na vzdělávání studentů a také z obav o bezpečnost a správnost obsahu, komentoval to slovy:

„GPTZero nebyl vytvořen proto, aby zastavil používání technologií, jako je ChatGPT. Jakoukoli novou technologii si musíme umět zodpovědně osvojit a mít pojistky proti jejímu zneužití.“ [1]

Udržet krok s ChatGPT

Přestože se ChatGPT a další AI jazykové modely neustále zlepšují, Tian je přesvědčen, že technologie, jako je GPTZero a jemu podobné AI detektory, s nimi dokážou udržet krok.

„Vytrénovat detekční modely je mnohem snazší než vytrénovat giganticky obrovské jazykové modely, jako je ChatGPT. Jejich vytrénování stojí miliony a miliony dolarů,“ říká. Jinými slovy, ChatGPT by nemohl vzniknout v kavárnách s wifi připojením během pár dnů, jako tomu bylo v případě GPTZero. [2]

Originalita zůstane i nadále důležitou dovedností

Vedle ICT studuje Edward Tian na Princetonu okrajově také žurnalistiku. Coby milovník psaní je taktéž přesvědčen, že lidská technika psaného projevu bude v budoucnu velmi cenná.

„Všechny tyto jazykové modely pouze vstřebávají obrovské porce internetu a reprodukují vzorce, ale nepřicházejí s ničím opravdu originálním. Takže schopnost psát originálně bude stále důležitou dovedností,“ dodává. [2]

GPTZero jako příběh

GPTZero je jen jedním z mnoha detektorů AI, které od spuštění modelu ChatGPT vznikly, a spousta dalších se určitě ještě objeví. GPTZero ale není jen o nástroji na detekci AI obsahu. Je o studentovi, který byl dost šílený na to, aby si myslel, že může změnit svět, a který dělá všechno pro to, aby to dokázal.

Literatura a použité zdroje

[1] – BOWMAN, Emma. A college student created an app that can tell whether AI wrote an essay. 2023. [cit. 2023-2-1]. Dostupný z WWW: [https://www.npr.org/2023/01/09/1147549845/gptzero-ai-chatgpt-edward-tian-plagiarism].

[2] – OFGANG, Erik. What is GPTZero? The ChatGPT Detection Tool Explained By Its Creator. 2023. [cit. 2023-2-1]. Dostupný z WWW: [https://www.techlearning.com/news/what-is-gptzero-the-chatgpt-detection-tool-explained].