META:n uusi AI Evaluator muuttaa laajan kielimallikoulutuksen, näin

META:n uusi AI Evaluator muuttaa laajan kielimallikoulutuksen, näin
Harsh Vardhan
22.10.2024, 20:57 IP.
  • Mallissa tulosten parantamiseksi käytetään itsenäistä oppimista, tehtävien antamista ja arviointia liikkeellä ollessa.
  • Se eliminoi ihmisen väliintulon tarpeen tekoälymallin eri vaiheissa.
  • Aika näyttää, onnistuuko tekoälyjärjestelmien kouluttaminen muilla tekoälyjärjestelmillä.

Vain kaksi kuukautta sitten OpenAI:n toimitusjohtajan Sam Altmanin kuultiin sanovan, että tekoälyn harjoittelu synteettisellä datalla (eli tekoälyn tuottamalla tiedolla) voi johtaa epäluotettaviin tekoälymalleihin.

META:n uusin tekoälyn arvioija, joka julkistettiin samaan aikaan, on jo todistamassa Altmanin olevan väärässä.

Metan Self-Taught AI Evaluator on suunniteltu auttamaan suurten kielimallien kehittämisessä sallimalla niiden itsensä arvioida ja kehittää itseään ilman ihmisen puuttumista.

Tällä hetkellä LLM:n parantaminen edellyttää tehotonta prosessia, jossa ammattitaitoiset ihmiset tarkistavat vastausten tarkkuuden, mikä nostaa huomattavasti sen käyttöönottoaikoja ja kustannuksia.

Lisäksi prosessi vaatii ihmisen tuottamaa dataa, jota on saatavilla vain rajallinen määrä.

META:n uusi malli voi nyt tuottaa dataa, jota voidaan käyttää muiden tekoälymallien kouluttamiseen, mikä tarkoittaa, että yksi ongelma on jo ratkaistu.

Se tarkoittaa myös, että ihmisiä ei tarvita valvomaan tekoälymalleihin syötettävän tiedon laatua. Tekoälyarvioija huolehtii myös siitä.

Itseoppineen arvioijan tärkeimmät ominaisuudet

Uudessa mallissa on kaksi pääominaisuutta, jotka voivat muuttaa tekoälyteollisuutta.

Ensinnäkin se käyttää itsenäistä oppimisominaisuutta tehtävien luomiseen ja niiden suorituskyvyn arvioimiseen, mikä eliminoi ammattitaitoisten ihmisten tarpeen tarkistaa käytetyt tiedot ja annetut vastaukset tehtävän ratkaisemiseksi.

Tämä vähentää mallien kehittämiseen ja parantamiseen liittyvää aikaa ja kustannuksia, mikä tuo skaalautuvuutta, joka on keskeinen vaatimus yrityksille, joiden on käytettävä malleja useilla alustoilla ja eri käyttäjien tarpeisiin.

Lisäksi tämä vähentynyt ihmisten osallistuminen vähentää myös mahdollista harhaa, jonka ihmiset ovat tuoneet malliin.

Toiseksi "Ajatusketjun" päättelytekniikkaa käytetään jäljittelemään ihmisen päättelyä tarjoamalla sarjan välivaiheita monimutkaisten tehtävien ratkaisemiseksi suoran vastauksen sijaan.

Tätä varten malli voi oppia aiemmasta onnistuneesta päättelystä, jota on käytetty samanlaisten ongelmien ratkaisemiseen.

Miksi tämä on iso juttu?

Mahdollisuus tuottaa synteettistä dataa muiden tekoälymallien kouluttamiseksi ja arvioimiseksi on iso juttu yrityksille, jotka haluavat käyttää tekoälyä asiakastuessa, työntekijöiden koulutuksessa tai juridisessa analyysissa.

Esimerkiksi asiakastuen chatbotissa käytetty malli voi jakaa ongelman sarjoiksi pienemmiksi vaiheiksi, joiden avulla voidaan tarkistaa mahdolliset ongelman syyt ja ohjata asiakasta löytämään ratkaisu.

Toisessa skenaariossa malli voi purkaa yrityksen sisäiset säännöt ja menettelytavat parantaakseen uusien työntekijöiden koulutusohjelmaa.

Yritykset voivat nopeasti mukauttaa nämä mallit omiin tarpeisiinsa rakentamatta ensin omaa malliaan, mitä ne ovat joutuneet tekemään tähän asti.

Toteutuksen riskit

Tällaisten tekoälyjärjestelmien käyttöönotossa on riskejä ja haasteita, jotka voivat johtaa suurempiin ongelmiin, jos niitä ei huomioida.

Siemenmallin laatu määrittää aina sen tehokkuuden ja sen, kuinka paljon siihen voi luottaa, kun sitä käytetään tosielämän sovelluksissa: jos malli on viallinen, myös vastaus voi olla virheellinen.

Toisaalta inhimillisen valvonnan puute voi johtaa vääriin tietoihin, joiden oletetaan olevan luotettavia syötteitä, mikä tuottaa vääriä tai epäoptimaalisia vastauksia. Malli voi antaa oikean vastauksen myös väärän logiikan jälkeen.

Vaikka malli näyttää teoriassa toimivan hyvin, vain aika näyttää, pystyykö se suorittamaan luotettavasti odotukset.

Tekoälyn kehitysvauhti huomioon ottaen meidän ei ehkä tarvitse odottaa kovin kauan.