Na Princetonské univerzitě se na začátku prosince nemluvilo o ničem jiném. Generativní jazykový model ChatGPT, který byl spuštěn 30. listopadu, na sebe i na zdejší škole strhl veškerou svou pozornost. Jeho pokročilost uchvátila jak místní učitele, tak studenty. Jednoho však víc než ostatní.
Edward Tian, 22letý student posledního ročníku oboru počítačová věda, si podobně jako mnoho lidí po celém světě, kteří chatbota vyzkoušeli, velmi rychle uvědomil obtížnost v rozeznávání obsahu vygenerovaného umělou inteligencí od toho, za kterým stojí člověk. A tak se rozhodl, že se této výzvě postaví a napíše program, který to rozeznat dokáže.
„Říkal jsem si, proč bych něco takového nemohl vybudovat a zjistit, zda to svět použije.”
Detektor AI textů nakonec vytvořil v průběhu několika dní o zimních prázdninách na konci roku 2022 a nazval jej GPTZero.
„Kolem ChatGPT je tolik hypu. Napsala AI tohle a tamto? My lidé si zasloužíme to vědět!“ publikoval Tian při představení své aplikace GTPZero na svém Twitteru.
GPTZero byl spuštěn 2. ledna a získal si spoustu pozitivní odezvy od těch, kteří jej vyzkoušeli. V prvním týdnu to bylo více jak 30 tisíc lidí. Stal se natolik populární, že platforma, na které byl hostován, spadla a její zdroje musely být provozovatelem navýšeny, aby zvládla požadovaný webový provoz.
Na základě reakcí uživatelů, kteří program v počáteční fázi testovali, Tian uznal, že jeho bot není bezchybný, a všem obratem vzkázal, že na přesnosti a vylepšení svého modelu stále pracuje. Od začátku také deklaroval, že chce aplikaci ponechat navždy volně dostupnou pro všechny. [1]
K určení, zda text napsal bot, používá GPTZero dva indikátory: „složitost“ a „výkyv“. Složitost měří komplikovanost textu; pokud je detektor GPTZero daným textem zmaten, pak je to tím, že tento text vykazuje vysokou složitost, a je tedy pravděpodobnější, že jej napsal člověk. Pokud se text zdá botu povědomý, protože na takových datech byl trénován, stane se méně komplexním, a tím pádem bude pravděpodobněji vygenerován pomocí AI.
Nezávisle na tomto přístupu je tu indikátor výkyvů, který srovnává odchylky ve větách. Lidé mají tendenci psát s většími výkyvy, tj. například používat delší a komplexnější věty současně s těmi kratšími. Věty od AI bývají obvykle mnohem uniformnější. [1]
Tian se též vymezil proti zákazu nástrojů, jako je ChatGPT. Když vzdělávací odbor města New York začal začátkem ledna blokovat přístup k modelu ChatGPT ve školních sítích a zařízeních z obav o jeho negativní dopady na vzdělávání studentů a také z obav o bezpečnost a správnost obsahu, komentoval to slovy:
„GPTZero nebyl vytvořen proto, aby zastavil používání technologií, jako je ChatGPT. Jakoukoli novou technologii si musíme umět zodpovědně osvojit a mít pojistky proti jejímu zneužití.“ [1]
Přestože se ChatGPT a další AI jazykové modely neustále zlepšují, Tian je přesvědčen, že technologie, jako je GPTZero a jemu podobné AI detektory, s nimi dokážou udržet krok.
„Vytrénovat detekční modely je mnohem snazší než vytrénovat giganticky obrovské jazykové modely, jako je ChatGPT. Jejich vytrénování stojí miliony a miliony dolarů,“ říká. Jinými slovy, ChatGPT by nemohl vzniknout v kavárnách s wifi připojením během pár dnů, jako tomu bylo v případě GPTZero. [2]
Vedle ICT studuje Edward Tian na Princetonu okrajově také žurnalistiku. Coby milovník psaní je taktéž přesvědčen, že lidská technika psaného projevu bude v budoucnu velmi cenná.
„Všechny tyto jazykové modely pouze vstřebávají obrovské porce internetu a reprodukují vzorce, ale nepřicházejí s ničím opravdu originálním. Takže schopnost psát originálně bude stále důležitou dovedností,“ dodává. [2]
GPTZero je jen jedním z mnoha detektorů AI, které od spuštění modelu ChatGPT vznikly, a spousta dalších se určitě ještě objeví. GPTZero ale není jen o nástroji na detekci AI obsahu. Je o studentovi, který byl dost šílený na to, aby si myslel, že může změnit svět, a který dělá všechno pro to, aby to dokázal.
Všechny články jsou publikovány pod licencí Creative Commons BY-NC-ND.
Článek nebyl prozatím komentován.
Pro vložení komentáře je nutné se nejprve přihlásit.
Tento článek je zařazen do seriálu Umělá inteligence.
Ostatní články seriálu: