Studenci Uniwersytetu w Toronto oraz Uniwersytetu Princeton wykorzystali wiedzę z zakresu sztucznej inteligencji do przygotowania narzędzia – GPTZero, które wykrywa treści wygenerowane za pomocą modeli językowych. Narzędzie ma pomóc w zachowaniu uczciwości w procesach edukacyjnych i twórczych oraz umożliwić internautom wstępną weryfikację wiarygodności zamieszczanych w sieci informacji.
Skala treści publikowanych w sieci, które zostały wygenerowane za pomocą sztucznej inteligencji, jest ogromna. Powszechny dostęp do modeli językowych sprawił, że możliwa jest masowa produkcja tekstów o niskiej jakości, które przyciągają czytelników, ale charakteryzują się małą wiarygodnością. Upowszechnienie dostępu do ChatGPT wywołało również wiele kontrowersji w obszarze edukacji. Instytucje oświatowe na całym świecie zostały zmuszone do dokonania zmian w sposobie egzaminowania uczniów i studentów, aby ograniczyć możliwość wspomagania się sztuczną inteligencją podczas pisania prac. Jest zatem pewne, że skuteczne i wiarygodne oprogramowanie antyplagiatowe, wykrywające treści od ChatGPT, może znaleźć ogromną liczbę zainteresowanych użytkowników na całym świecie.
Odróżnienie ludzkiej pracy od pracy modeli językowych
Szanse rozwoju projektu GPTZero szybko dostrzegli inwestorzy. W krótkim czasie narzędzie otrzymało 3,5 mln dolarów dofinansowania na wczesny rozwój projektu. Aby umożliwić odróżnienie ludzkiej pracy od pracy modeli językowych, konieczne było trenowanie modeli na ogromnej liczbie tekstów napisanych przez człowieka. Ostatecznie GPTZero ocenia tekst pod kątem złożoności (w jakim stopniu dobór słów jest losowy i czy konstrukcje zdań są przewidywalne) oraz zmienności. Okazuje się, że treści tworzone przez sztuczną inteligencję są dużo bardziej powtarzalne, przewidywalne i schematyczne niż te, pisane przez człowieka. I tę prawidłowość sztuczna inteligencja jest w stanie „wyłapać”.
Konieczne doskonalenie detektorów
Detektory tekstów pisanych przez sztuczną inteligencję, takie jak GPTZero budzą jednak pewne wątpliwości w kontekście ich oficjalnego wykorzystania. W praktyce ocena oryginalności tekstu pozostaje kwestią kontrowersyjną i podatną na błędne wnioskowanie. W przyszłości okaże się, czy detektory treści generowanych przez AI będą uznane za niezawodne, czy pozostaną dyskretnie stosowaną taktyką oceny wiarygodności publikacji.
Więcej na temat projektu GPTZero na stronie: link