Miksi liian itsevarmat tekoälymallit asettavat itsevarmuuden tarkkuuden edelle

Miksi liian itsevarmat tekoälymallit asettavat itsevarmuuden tarkkuuden edelle
Sayantan Sarkar
19.11.2025, 18:09 IP.
  • Tekoälyjärjestelmät tuottavat vääriä väitteitä jopa 40 % (EBU-tutkimus).
  • Nykymallit suosivat "sujuvuutta tarkkuuden sijaan", mikä aiheuttaa "tekoälyhallusinaatioita."
  • Tekoälyn tarkkuusrajoitukset tekevät ihmisen valvonnasta, kriittisestä ajattelusta ja validoinnista korvaamatonta.

Huoli tekoälymallien luotettavuudesta kasvaa, sillä uusi tutkimus paljastaa, että jotkut suositut järjestelmät tuottavat virheellistä tietoa yli kolmanneksessa vastauksistaan, vaikka tekoälyteknologiaan kohdistuu yhä enemmän luottamusta, ING Group kertoi keskiviikkona.

Nykyaikaiset tekoälymallit, joissa on syvä päättelykyky, pitkäkestoinen muisti ja autonomiset toimijat, pystyvät suorittamaan tehtäviä kuten verkkoselailua mahdollisimman vähäisellä ihmisen puuttumisella.

Kuitenkin näiden tehtävien suorittaminen vaatii laajaa dataa, mikä johtaa suurempaan riippuvuuteen ulkoisista tietolähteistä, jotka ovat usein hallitsemattomia ja varmentamattomia, kertoi ING:n nuorempi taloustieteilijä Julian Geib, globaalista kaupasta, raportissaan.

Ylimielisyys

Johtavat tekoälyjärjestelmät tuottavat vääriä väitteitä jopa 40 %:n nopeudella, mikä on korostettu Euroopan yleisradioliiton (EBU) äskettäin tekemässä tutkimuksessa.

Vastausten lisääntynyt tiheys vastaa tekoälymallin käyttäytymisen muutosta.

Aikaisemmat tekoälyjärjestelmät oli ohjelmoitu kieltäytymään vastaamasta kysymyksiin aiheista, jotka eivät kuulu heidän koulutusaineistoihinsa.

Nykyaikaiset verkkoyhteydet on kuitenkin suunniteltu vastaamaan useammin, vaikka saatavilla oleva tieto olisi rajallista tai epävarmaa.

Lisääntynyt käyttäjien sitoutuminen on etu, mutta se johtaa enemmän tekaistuun lopputulokseen, jota kutsumme "tekoälyhallusinaatioiksi", Geib sanoi.

Sujuvuus tarkkuuden sijaan

Jopa uudemmat tekoälymallit kokevat usein hallusinaatioita monista syistä.

Ensisijaisesti, kun käyttäjät esittävät epämääräisiä tai liian monimutkaisia kysymyksiä, malli kamppailee tulkinnan kanssa.

Tämä johtaa usein siihen, että malli turvautuu tilastollisiin kuvioihin "täyttääkseen aukot", tuottaen näennäisen täydellisen, mutta mahdollisesti faktuaalisesti epätarkan vastauksen, Geib sanoi.

Vaikka nämä vastaukset pyrkivät olemaan hyödyllisiä, ne voivat sisältää virheellistä tietoa.

Mallien hienosäätö ihmispalautteen perusteella suosii usein itsevarmoja, hyödyllisiltä kuulostavia vastauksia, mikä johtaa epätarkkoihin mutta määrätietoisiin väitteisiin varovaisten tai epävarmojen vastausten sijaan.

Ongelmaa pahentaa romahtava "ei vastausprosentti".

Vanhemmat mallit kieltäytyivät lähes 40 % kyselyistä, mutta uudemmat vastaavat lähes kaikkeen.

Kriittisillä aloilla, kuten politiikassa ja terveydenhuollossa, sujuvuuden asettaminen tarkkuuden edelle aiheuttaa vakavia väärän tiedon riskejä.

Tekoäly on yleistymässä ajankohtaisten tapahtumien tiedon saamisessa, erityisesti nuorempien väestöryhmien keskuudessa.

Huomionarvoista on, että 15 % alle 25-vuotiaista kertoo luottavansa tekoälychatboteihin pääasiallisena uutislähteenä.

"Koska tekoälyn käyttö kasvaa sekä yksityisesti että yrityksissä, tarkkuuden tulisi olla etusijalla", Geib sanoi.

Tietoisuus on elintärkeää

Geib lisäsi:

Tekoälyn tarkkuuden nykyiset rajoitukset viittaavat siihen, että koko ammatillisten alojen täydellinen korvaaminen lähitulevaisuudessa on merkittävästi pieni todennäköisyys tapahtuma, Geibin mukaan.

Tämä johtuu pääasiassa siitä, että ihmisammattilaiset useimmilla aloilla toimivat vivahteikkaalla harkintakyvyllä, kontekstuaalisella ymmärryksellä ja tarkkuudella, jota nykyiset tekoälyjärjestelmät eivät pysty johdonmukaisesti jäljittelemään.

Laajamittaisen työpaikkojen menetyksen riski on siis kriittinen vain tilanteissa, joissa ammatin ammattilaiset ovat täysin riippuvaisia – eivätkä pysty kriittisesti varmistamaan – tekoälyn tuottamia mahdollisesti virheellisiä tai virheellisiä tietoja ja johtopäätöksiä.

Pohjimmiltaan tekoäly toimii tällä hetkellä voimakkaana, mutta epätäydellisenä työkaluna, ja sen epätarkkuudet varmistavat, että ihmisen valvonta, kriittinen ajattelu ja validointi pysyvät ammatillisen työn välttämättöminä osina.

"Tekoälyn tuottamia lausuntoja tulisi käsitellä samalla kriittisellä ajattelutavalla kuin ihmisten väitteitä", Geib totesi.