Sztuczna inteligencja kontra ChatGPT. Test systemów do wykrywania tekstów napisanych przez SI
Wraz z rozwojem coraz doskonalszych generatorów tekstu, takich jak ChatGPT, coraz częściej pojawiają się głosy o potrzebie opracowania metod wykrywania tekstów stworzonych przez sztuczną inteligencję. Metody takie przydałyby się nauczycielom czy wykładowcom akademickim, którzy mogliby identyfikować prace pisemne przyniesione przez nieuczciwych uczniów i studentów, przedstawiających wygenerowany przez komputer tekst jako własne dzieło. Mówi się o kursach z wykrywania oszustw i o tworzeniu odpowiednich narzędzi. Takie narzędzia – bazujące na sztucznej inteligencji – już powstają. Problem w tym, że nie są one zbyt wiarygodne.
Naukowcy z Uniwersytetu Stanforda przyjrzeli się kilku algorytmom sztucznej inteligencji, które mają określać, czy zaprezentowany tekst został stworzony przez człowieka czy też przez inną sztuczną inteligencję. O ile jednak takie algorytmy sprawdzają się „niemal doskonale” podczas analizy tekstów pisanych przez 13-14-latków urodzonych w USA, to już zawodzą tam, gdzie mają do czynienia z angielskim tekstem napisanym przez osobę, dla której angielski nie jest językiem ojczystym. Okazało się bowiem, że gdy systemy te miały ocenić, kto jest autorem tekstu napisanego w ramach egzaminu TOEFL (Test of English as a Foreign Language), w aż 61,22% uznały, że to SI stworzyła tekst, który został napisany przez człowieka. W rzeczywistości jest jednak jeszcze gorzej. Aż 19% prac napisanych przez nastolatków, dla których angielski nie jest językiem ojczystym, zostało uznanych za stworzone przez SI przez wszystkie 7 badanych narzędzi do wykrywania fałszywek. A aż 97% napisanych przez ludzi prac zostało uznane za fałszywe przez co najmniej jeden z systemów.
Problem tkwi tutaj w sposobie pracy systemów wykrywających tekst napisany przez Si. Opierają się one bowiem na złożoności użytego języka. Oczywistym jest, że przeciętna osoba, która nie jest rodzimym użytkownikiem języka angielskiego ma mniejszy zasób słownictwa, a tworzone przez nią zdania są prostsze pod względem gramatycznym i składniowym od zdań rodzimego użytkownika angielskiego. Sztuczna inteligencja, próbując wykryć fałszywki, uznaje ten niższy poziom złożoności za znak, że tekst został stworzony przez sztuczną inteligencję. To poważny problem, gdyż uczeń czy student, który urodził się poza USA, może w ten sposób zostać uznany przez nauczyciela za oszusta, mimo że sam napisał pracę.
Co więcej, naukowcy ze Stanforda zauważyli, że takie systemy łatwo jest oszukać nawet rodzimemu użytkownikowi angielskiego. Okazuje się bowiem, że wystarczy wygenerować tekst za pomocą ChataGPT, a następnie wydać maszynie polecenie, by poprawiła ten tekst dodając doń słownictwo literackie.
Obecne wykrywacze są niewiarygodne i łatwo je oszukać, dlatego też należy używać ich bardzo ostrożnie w roli remedium na oszukiwanie za pomocą sztucznej inteligencji, mówi jeden z autorów badań, profesor James Zou.
Uczony uważa, że w najbliższej przyszłości nie należy ufać takim wykrywaczom, szczególnie w tych szkołach i uczelniach, gdzie mamy dużo uczniów, dla których angielski nie jest językiem macierzystym. Po drugie, twórcy narzędzi do wykrywania muszą zrezygnować ze złożoności jako głównego wyznacznika analizy tekstu i opracować bardziej zaawansowane techniki. Ponadto ich systemy powinny być bardziej odporne na obejście. Być może rozwiązanie problemu leży po stronie twórców takich systemów jak ChatGPT. Zou sugeruje, że tego typu generatory mogłyby dodawać do tekstu rodzaj znaku wodnego, którym byłyby subtelne sygnały, oczywiste dla systemów wykrywających, stanowiące niejako podpis generatora i wskazujące, że to on jest autorem.
Komentarze (4)
radar, 19 maja 2023, 20:33
Przy takiej złożoności LLM, w tym ChatGPT, moim zdaniem nie ma szans wykryć, że to Chat jest autorem. Możesz mu kazać poprawić błędy, napisać w jakimś konkretnym stylu, itd.
Co do znaku wodnego, ciężki pomysł. Jak niby miało by się to odbywać, skoro LLM imituje "mowę" ludzką, jest na niej wytrenowany i generuje ciąg słów tak jak człowiek (aczkolwiek bez sensu). Można by technicznie dodawać coś w post-procesingu, ale co, steganografia? Jak niby to miało by wyglądać? Do tego musiało by być jawne, a więc również łatwe do wykrycia, a co za tym idzie do usunięcia. Uczniowie nauczyliby się tego zanim powstał by pierwszy wykrywacz dla nauczycieli
ksalem, 20 maja 2023, 05:54
Jak dla mnie edukacja to nie pisanie tekstów takich jak wypracowania zadane do domu. Szkoła nawet podstawowa jak dla mnie przestała uczyć przechodząc na tryb studiów.
Wykazanie posiadanej wiedzy można okazać w wiele innych sposobów a i tak podstawą jest jak najszybszy dostęp do posiadanej wiedzy.
Teraz szkolnictwo zapędziło się w kozi róg i nauczyciele dalej brną w tym kierunku by się nie narobić sprawdzając wiedzę swoich uczniów.
Łatwiej im zadać cały program nauczania do domu a później na ładne oczy dać oceny.
Przypomina mi się ze studiów przykład jak z dwójką znajomych daliśmy praktycznie identyczne opracowania tego samego tematu bo mieliśmy pod ręką tą samą książkę. Traf chciał, że wykładowca wziął do ręki pierwszą pracę moją, bo następna miała ocenę mniej a trzecia niezaliczona.
Ergo Sum, 20 maja 2023, 22:01
Na razie wszystkie generatory czatów AI mają jedną cechę: odpowiadając objaśniają teorię, co dla człowieka jest rzeczą zbędną, gdyż zakłada on że czytelnik ma oczywistą wiedzę. Bardzo często jest tak że ChatGPT pytany o konkret zaczyna się rozwodzić nad samą teorią danej problematyki. Z reguły ludzie po prostu mniej gadają. Wszelkie AI na razie gadają bardzo kwieciście. Weźmy choć Sophię - wystarczy spytać "jaka jest pogoda" - żeby usłyszeć co najmniej z 5 długich zdań - podczas gdy człowiek odpowie "a, leje"
radar, 28 maja 2023, 01:39
ChatGPT jest narzędziem jak wszystko inne. Nie wie czego oczekujesz "Ty", a jest nauczony/poinstruowany odpowiadać obszernie. Natomiast, nic nie stoi na przeszkodzie powiedzieć mu o tym zadając pytanie i wtedy już masz. Wygooglaj "prompt engineering", a dowiesz się jak prawidłowo z nim rozmawiać i zadawać pytania, a otrzymasz 100x lepsze wyniki. Ba, jego zapytaj o to jak poprawnie to robić, z tym, że polecam po angielsku jednak, po polsku kaleczy, dużo tłumaczy z angielskiego w tle co rodzi dziwne sytuacje.
Zresztą:
Zmień towarzystwo