Factchecking i halucynacje AI, czyli weryfikacja efektów pracy z AI

W świecie sztucznej inteligencji linie między fikcją a rzeczywistością czasem się rozmywają. Podczas gdy innowacyjne systemy AI przyspieszają postęp w niemal każdej dziedzinie, towarzyszą im również wyzwania, takie jak tzw. halucynacje – zjawisko, w którym AI generuje niedokładne lub nawet fałszywe informacje. Aby w pełni wykorzystać potencjał tej technologii, musimy zrozumieć fenomen halucynacji i nauczyć się nim zarządzać.

Factchecking i halucynacje AI – omówione zagadnienia:

Pokaż więcej ↓

Czym są i skąd się biorą halucynacje sztucznej inteligencji?

Halucynacje AI to zachowanie systemu sztucznej inteligencji, polegające na tym, że generuje on niedokładne lub zupełnie błędne informacje, co może prowadzić do poważnych konsekwencji. To zjawisko ma swoje korzenie w samym sercu uczenia maszynowego – procesie, w którym algorytmy wykorzystują olbrzymie zbiory danych, czyli dane treningowe, do rozpoznawania wzorców i generowania odpowiedzi według zaobserwowanych prawidłowości.

Nawet najbardziej zaawansowane modele AI nie są wolne od wad. Jedną z przyczyn halucynacji są właśnie niedoskonałości danych treningowych. Jeśli zestaw danych jest niewystarczający, niepełny lub obciążony uprzedzeniami, system uczy się nieprawidłowych korelacji i wzorców, co prowadzi do wytwarzania fałszywych treści.

Przykładowo, wyobraźmy sobie model AI przeznaczony do rozpoznawania twarzy, który został wytrenowany głównie na zdjęciach osób rasy kaukaskiej. W takim przypadku algorytm może mieć problemy z prawidłową identyfikacją przedstawicieli innych grup etnicznych, ponieważ nie został odpowiednio „wyedukowany” w tym zakresie.

Kolejną przyczyną halucynacji jest tzw. przeuczenie modelu, czyli sytuacja, gdy algorytm zbyt precyzyjnie dopasowuje się do zestawu danych treningowych. W rezultacie traci zdolność do uogólniania i poprawnego rozpoznawania nowych, nieznanych wcześniej wzorców. Taki model będzie się świetnie sprawdzał na danych treningowych, ale zawiedzie w rzeczywistych, dynamicznych warunkach.

Wreszcie, halucynacje mogą być wynikiem wadliwych założeń lub nieodpowiedniej architektury modelu. Jeśli projektanci AI oparli swoje rozwiązanie na błędnych przesłankach lub użyli niewłaściwej struktury algorytmów, wtedy system będzie generował nieprawdziwe treści, próbując „dopasować” te nieprawidłowe założenia do rzeczywistych danych.

Źródło: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Przykłady halucynacji

Wpływ halucynacji AI wykracza daleko poza sferę teorii – coraz częściej spotykamy się z ich realnymi, czasem zaskakującymi przejawami. Oto kilka przykładów tego zjawiska z różnych dziedzin:

w maju 2023 roku pewien prawnik użył ChatGPT do przygotowania wniosku procesowego, który zawierał fikcyjne cytaty z orzeczeń sądowych i nieistniejące precedensy prawne. Spowodowało to poważne konsekwencje – nałożenie kary finansowej na adwokata, który twierdził, że nie zdawał sobie sprawy ze zdolności ChatGPT do generowania takich fałszywych informacji;
zdarza się, że ChatGPT tworzy fałszywe informacje na temat realnych osób. W kwietniu 2023 roku model sfabrykował historię o rzekomym nękaniu studentów przez pewnego profesora prawa. W innym przypadku błędnie oskarżył australijskiego burmistrza o przyjmowanie łapówek, podczas gdy w rzeczywistości był on sygnalistą ujawniającym tego rodzaju praktyki.

Nie są to odosobnione przypadki – generatywne modele AI często wymyślają „fakty” historyczne, na przykład podając nieprawdziwe rekordy w przekraczaniu kanału La Manche. Co więcej, za każdym razem mogą one tworzyć zupełnie inne fałszywe informacje na ten sam temat.

Jednak halucynacje AI to nie tylko problem błędnych danych. Mogą one również przyjmować bardzo dziwne, niepokojące formy, jak w przypadku chatbota Binga, który oświadczył, że jest zakochany w dziennikarzu Kevinie Roose. Pokazuje to, że skutki tych anomalii mogą wykraczać poza zwykłe błędy faktograficzne.

Wreszcie, halucynacje mogą być celowo wywoływane poprzez specjalne ataki na systemy AI, tzw. adversarial attacks. Na przykład niewielka modyfikacja zdjęcia kota spowodowała, że system rozpoznawania obrazów zinterpretował je jako… „guacamole”. Tego rodzaju podatności na manipulacje mogą mieć poważne konsekwencje w systemach, których dokładne rozpoznawanie obrazu jest kluczowe, jak na przykład w autonomicznych pojazdach.

Jak zapobiegać halucynacjom?

Pomimo skali wyzwania, jakim są halucynacje AI, istnieją skuteczne metody ograniczania tego zjawiska. Kluczem jest kompleksowe podejście łączące:

wysokiej jakości dane treningowe;
odpowiednie prompty, czyli polecenia dla AI;
kontekstualizację zapytań, czyli bezpośrednie dostarczanie wiedzy i przykładów, z których może czerpać sztuczna inteligencja;
ciągły nadzór sprawowany przez ludzi oraz samą sztuczną inteligencję w celu doskonalenia systemów AI.

Prompty

Jednym z kluczowych narzędzi w walce z halucynacjami są właściwie skonstruowane prompty, czyli polecenia i instrukcje kierowane do modelu AI. Często wystarczą drobne modyfikacje w formacie promptu, by drastycznie poprawić precyzję i wiarygodność generowanych odpowiedzi.

Doskonałym przykładem jest tutaj model językowy Claude 2.1 firmy Anthropic. Podczas gdy korzystanie z długiego kontekstu dawało 27% trafności przy braku odpowiedniego polecenia, po dodaniu do promptu zdania „Oto najbardziej istotne zdanie z kontekstu: ”, skuteczność wzrosła aż do 98%.

Taka modyfikacja w istocie wymusiła na modelu koncentrację na najbardziej relewantnych fragmentach tekstu, zamiast generowania odpowiedzi na podstawie pojedynczych, wyrwanych z kontekstu zdania. Uświadamia to, jak ważną rolę odgrywają właściwie sformułowane polecenia w zwiększaniu precyzji systemów AI.

Konstruowanie bardzo szczegółowych, doprecyzowanych promptów, pozostawiających AI jak najmniej pola do swobodnej interpretacji także pomaga zmniejszyć ryzyko halucynacji i ułatwia factchecking. Im jaśniejsze i bardziej konkretne polecenie, tym mniejsza szansa na halucynacje.

Przykłady

Poza sprawnymi promptami istnieje wiele innych metod ograniczania ryzyka halucynacji AI. Oto niektóre z kluczowych strategii:

używanie wysokiej jakości, zróżnicowanych danych treningowych, rzetelnie reprezentujących rzeczywisty świat i możliwe scenariusze. Im bogatsze i bardziej kompletne dane, tym mniejsze ryzyko wygenerowania przez AI nieprawdziwych informacji;
stosowanie szablonów danych jako przewodnika dla odpowiedzi AI – definiowanie dopuszczalnych formatów, zakresów i struktur wyjściowych, co zwiększa spójność i dokładność generowanych treści;
ograniczanie źródeł danych wyłącznie do wiarygodnych, zweryfikowanych materiałów od zaufanych podmiotów. Eliminuje to ryzyko, że model „nauczy się” informacji z niepewnych lub fałszywych źródeł.

Ciągłe testowanie i udoskonalanie systemów AI w oparciu o analizy ich faktycznej wydajności i dokładności, pozwala na bieżąco korygować wszelkie niedociągnięcia i uczyć model na błędach.

Kontekst

Istotną rolę w zapobieganiu halucynacjom pełni również właściwe zdefiniowanie kontekstu działania systemów AI. Należy jasno sprecyzować cel, do którego dany model będzie wykorzystywany oraz określić ograniczenia i zakresy jego odpowiedzialności.

Takie podejście pozwala ustawić wyraźne ramy funkcjonowania AI, w których będzie się ona poruszać, zmniejszając ryzyko „wymyślania” przez nią informacji niepożądanych czy wykraczających poza zakres jej przeznaczenia. Dodatkowym zabezpieczeniem może być stosowanie narzędzi filtrujących oraz ustalenie progów prawdopodobieństwa dla dopuszczalnych wyników.

Zastosowanie tych środków pomaga wytyczyć bezpieczne ścieżki działania dla AI, zwiększając dokładność i wiarygodność generowanych przez nią treści w zakresie wyznaczonych zadań i dziedzin.

Źródło: Ideogram, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Factchecking. Jak weryfikować efekty pracy z AI?

Niezależnie od zastosowanych środków zapobiegawczych, pewna doza halucynacji ze strony systemów AI jest niestety nie do uniknięcia. Dlatego kluczowym elementem gwarantującym wiarygodność uzyskiwanych wyników jest factchecking – proces weryfikacji faktów i danych generowanych przez modele AI dokonywany przez ludzi.

Przeglądanie efektów pracy AI pod kątem dokładności i zgodności z rzeczywistością należy traktować jako jedno z podstawowych zabezpieczeń przed rozprzestrzenianiem się fałszywych informacji. Weryfikacja ludzka pozwala identyfikować i korygować wszelkie halucynacje oraz niedokładności, których algorytmy nie były w stanie wykryć samodzielnie.

W praktyce factchecking powinien być cyklicznym procesem, obejmującym regularne przeszukiwanie treści generowanych przez AI w poszukiwaniu błędów lub wątpliwych stwierdzeń. Po ich zidentyfikowaniu niezbędna jest nie tylko korekta samej wypowiedzi wygenerowanej przez sztuczną inteligencję, ale także aktualizacja, uzupełnienie lub redakcja danych treningowych modelu AI, aby zapobiec powtórzeniu się podobnych uchybień w przyszłości.

Co istotne, proces weryfikacji nie może ograniczać się do prostego odrzucania lub zatwierdzania wątpliwych fragmentów, ale powinien aktywnie angażować ludzkich ekspertów dysponujących pogłębioną wiedzą w danej dziedzinie. Tylko oni są w stanie właściwie ocenić kontekst, trafność i dokładność wypowiedzi generowanych przez AI oraz zadecydować o ewentualnych korektach.

Ludzki factchecking stanowi tym samym niezbędne i trudne do przecenienia „zabezpieczenie” wiarygodności treści AI. Dopóki algorytmy uczenia maszynowego nie osiągną doskonałości, ten żmudny, ale kluczowy proces musi pozostać integralną częścią pracy z rozwiązaniami AI w każdej branży.

Jak skorzystać na halucynacjach AI?

Choć halucynacje AI są z zasady niepożądanym zjawiskiem, które należy minimalizować, to jednak w niektórych wyjątkowych obszarach mogą one znaleźć zaskakująco ciekawe i wartościowe zastosowanie. Pomysłowa eksploatacja kreatywnego potencjału halucynacji daje nowe, często zupełnie niespodziewane perspektywy.

Sztuka i projektowanie to dziedziny, w których halucynacje AI mogą otworzyć zupełnie nowe ścieżki twórcze. Wykorzystując tendencję modeli do generowania surrealistycznych, abstrakcyjnych obrazów, artyści i designerzy mogą eksperymentować z zupełnie nowymi formami wyrazu, rozmywającymi granice między sztuką a rzeczywistością. Mogą również tworzyć całkowicie unikatowe, oniryczne światy – niedostępne dotąd dla ludzkiej percepcji.

Z kolei w sferze wizualizacji i analizy danych, zjawisko halucynacji daje sposobność do odkrywania alternatywnych perspektyw i nieoczekiwanych powiązań w złożonych zbiorach informacji. Zdolność AI do wyłapywania nieprzewidywalnych korelacji może ułatwić na przykład podejmowanie decyzji inwestycyjnych czy zarządzanie ryzykiem przez instytucje finansowe.

Wreszcie, świat gier komputerowych i rozrywki wirtualnej może również skorzystać na kreatywnych aberracjach AI. Twórcy tych rozwiązań mogą wykorzystywać halucynacje do generowania zupełnie nowych, urzekających światów wirtualnych. Wzbogacając je o element zaskoczenia i nieprzewidywalności, mogą zapewnić graczom niezrównane, immersyjne doznania.

Oczywiście, każde wykorzystanie tej „kreatywnej” strony halucynacji AI musi być starannie kontrolowane i podlegać ścisłemu nadzorowi ludzkiemu. W przeciwnym razie tendencja do wymyślania fikcji, zamiast faktów, może prowadzić do sytuacji niebezpiecznych lub społecznie niepożądanych. Kluczem jest zatem umiejętne wyważenie korzyści i ryzyk związanych z tym zjawiskiem i odpowiedzialne aplikowanie go wyłącznie w bezpiecznych, uporządkowanych ramach.

Podsumowanie

Pojawienie się zjawiska halucynacji w systemach sztucznej inteligencji jest nieuniknionym skutkiem ubocznym rewolucji, jakiej jesteśmy świadkami w tej dziedzinie. Wypaczenia i nieprawdziwe informacje generowane przez modele AI stanowią bowiem odwrotną stronę ich ogromnej kreatywności i zdolności do przyswajania kolosalnej ilości danych.

Na razie jedynym sposobem na weryfikację prawdziwości treści generowanych przez AI jest ich sprawdzanie przez człowieka. Choć istnieje wiele metod służących do zmniejszania halucynacji – od technik promptowania po złożone metody takie jak Truth Forest – na razie żadna z nich jest w stanie zapewnić zadowalającej trafności odpowiedzi, która wyeliminowałaby potrzebę factcheckingu.