Dlaczego zbyt pewne siebie modele AI stawiają asertywność ponad dokładność

Dlaczego zbyt pewne siebie modele AI stawiają asertywność ponad dokładność
Sayantan Sarkar
19 lis 2025, 17:09 PM
  • Systemy AI generują fałszywe twierdzenia w tempie sięgającym nawet 40% (badania EBU).
  • Współczesne modele preferują "płynność zamiast dokładności", powodując "halucynacje AI".
  • Ograniczenia dokładności AI sprawiają, że ludzki nadzór, krytyczne myślenie i walidacja są niezbędne.

Narastają obawy dotyczące wiarygodności modeli sztucznej inteligencji, ponieważ nowe badania pokazują, że niektóre popularne systemy generują błędne informacje w ponad jednej trzeciej swoich odpowiedzi, mimo rosnącego zaufania i zaufania pokładanego w technologii AI, poinformowała w środę ING Group.

Nowoczesne modele AI, wyposażone w głębokie rozumowanie, pamięć długotrwałą i autonomicznych agentów, mogą wykonywać zadania takie jak przeglądanie internetu przy minimalnej ingerencji człowieka.

Jednak realizacja tych zadań wymaga obszernych danych, co prowadzi do większego uzależnienia od zewnętrznych źródeł danych, które często są niekontrolowane i niezweryfikowane, powiedział w raporcie Julian Geib, młodszy ekonomista ds. handlu globalnego z ING.

Nadmierna pewność siebie

Wiodące systemy AI generują fałszywe twierdzenia w tempie sięgającym nawet 40%, co podkreśliło niedawne badanie Europejskiej Unii Nadawców (EBU).

Zwiększona częstotliwość odpowiedzi pokrywa się ze zmianą zachowania modeli AI.

Wcześniejsze systemy AI były zaprogramowane tak, by odmawiać odpowiedzi na zapytania dotyczące tematów spoza ich zbiorów danych treningowych.

Jednak współczesne systemy z łącznością internetową są zaprojektowane tak, by odpowiadać częściej, nawet gdy dostępne informacje są ograniczone lub niepewne.

Zwiększone zaangażowanie użytkowników to zaleta, ale skutkuje większą liczbą wymyślonych efektów, które nazywamy "halucynacjami AI", powiedział Geib.

Płynność ponad dokładność

Nawet nowsze modele AI często doświadczają halucynacji z kilku powodów.

Przede wszystkim, gdy użytkownicy zadają niejasne lub zbyt złożone pytania, model ma trudności z interpretacją.

Często prowadzi to do polegania na wzorcach statystycznych, aby "uzupełnić luki", generując pozornie kompletną, ale potencjalnie niedokładną odpowiedź, powiedział Geib.

Chociaż te odpowiedzi mają być pomocne, mogą wprowadzać błędne informacje.

Dopracowywanie modeli z ludzką informacją zwrotną często faworyzuje pewne siebie, pomocne odpowiedzi, co prowadzi do tendencji do niedokładnych, ale stanowczych stwierdzeń zamiast ostrożnych lub niepewnych odpowiedzi.

Problem pogłębia gwałtowny spadek "braku odpowiedzi".

Starsze modele odrzuciły prawie 40% zapytań, ale nowsze odpowiadają na prawie wszystko.

W kluczowych dziedzinach, takich jak polityka i zdrowie, to przedkładanie płynności ponad dokładność stwarza poważne ryzyko dezinformacji.

AI staje się coraz powszechniejszym narzędziem do uzyskiwania informacji o bieżących wydarzeniach, zwłaszcza wśród młodszych grup demograficznych.

Co istotne, 15% osób poniżej 25. roku życia deklaruje, że polega na chatbotach AI jako głównym źródle wiadomości.

"Biorąc pod uwagę rosnące wykorzystanie AI zarówno prywatnie, jak i w biznesie, dokładność powinna być priorytetem," powiedział Geib.

Świadomość kluczowa

Geib dodał:

Obecne ograniczenia w dokładności AI sugerują, że masowe zastąpienie całych dziedzin zawodowych w najbliższej przyszłości jest wydarzeniem o znacznie niskim prawdopodobieństwie, według Geib.

Wynika to głównie z faktu, że profesjonaliści w większości dziedzin działają z takim stopniem wyrafinowanego osądu, zrozumienia kontekstu i dokładnością, którego obecne systemy AI mają trudności z konsekwentnym odtworzeniem.

Ryzyko masowej utraty miejsc pracy staje się więc krytyczne tylko w sytuacjach, gdy praktycy w danej profesji całkowicie polegają na potencjalnie wadliwym lub błędnym zweryfikowaniu potencjalnie wadliwych lub błędnych danych i wniosków generowanych przez AI.

W istocie SI obecnie pełni rolę potężnego, choć niedoskonałego narzędzia, a jego nieścisłości sprawiają, że ludzki nadzór, krytyczne myślenie i walidacja pozostają niezbędnymi elementami pracy zawodowej.

"Wypowiedzi generowane przez AI powinny być traktowane z takim samym krytycznym nastawieniem jak twierdzenia ludzkie," zauważył Geib.