Noul Evaluator AI al META va transforma formarea de modele lingvistice mari, iată cum

În urmă cu doar două luni, CEO-ul OpenAI, Sam Altman, a fost auzit spunând că antrenarea AI pe date sintetice (adică date generate de AI) ar putea duce la modele AI nesigure.

Cel mai recent evaluator AI al META, care a fost anunțat în același timp, încearcă deja să demonstreze că Altman se înșeală.

Evaluatorul AI autodidact de la Meta este conceput pentru a ajuta la dezvoltarea modelelor de limbaj mari, permițându-le să se autoevalueze și să se auto-îmbunătățească fără intervenția umană.

În prezent, îmbunătățirea LLM-urilor necesită un proces ineficient în care oamenii calificați verifică exactitatea răspunsurilor, ceea ce crește considerabil timpul și costurile de adoptare.

Mai mult, procesul necesită date generate de om, ceva care este disponibil doar în cantitate finită.

Noul model META poate genera acum date care pot fi folosite pentru a antrena alte modele AI, ceea ce înseamnă că o problemă este deja rezolvată.

De asemenea, înseamnă că nu va fi nevoie de oameni pentru a supraveghea calitatea datelor care sunt furnizate modelelor AI. Evaluatorul AI se va ocupa și de asta.

Caracteristicile cheie ale evaluatorului autodidact

Noul model are două caracteristici principale care ar putea transforma industria AI.

În primul rând, folosește o funcție de învățare autonomă pentru a genera sarcini și a evalua performanța acestora, eliminând nevoia oamenilor calificați de a verifica datele utilizate și răspunsurile date pentru a rezolva sarcina în cauză.

Acest lucru reduce timpul și costurile asociate cu dezvoltarea și îmbunătățirea modelelor, aducând scalabilitate, o cerință cheie a corporațiilor care trebuie să utilizeze modelele pe mai multe platforme și pentru nevoile diferiților utilizatori.

În plus, această participare umană redusă reduce, de asemenea, părtinirea potențială introdusă în model de către oameni.

În al doilea rând, o tehnică de raționament „Lanțul gândirii” este folosită pentru a emula raționamentul uman, oferind o serie de pași intermediari către rezolvarea unor sarcini complexe, în loc să ofere un răspuns direct.

Pentru aceasta, modelul poate învăța din raționamentul de succes anterior folosit pentru a rezolva probleme similare.

De ce este asta mare lucru?

Capacitatea de a genera date sintetice pentru instruirea și evaluarea altor modele AI este o problemă importantă pentru companiile care doresc să folosească AI în asistența clienților, formarea angajaților sau analiza juridică.

De exemplu, utilizat într-un chatbot de asistență pentru clienți, modelul poate descompune problema într-o serie de pași mai mici pentru a verifica posibilele cauze ale problemei și pentru a ghida clientul în găsirea unei soluții.

Într-un alt scenariu, modelul poate deconstrui regulile și procedurile interne ale unei companii pentru a îmbunătăți programul de formare pentru noii angajați.

Corporațiile pot adapta rapid aceste modele la propriile nevoi, fără a-și construi mai întâi propriul model, lucru pe care au trebuit să-l facă până acum.

Riscuri de implementare

Implementarea unor astfel de sisteme AI are riscuri și provocări care, dacă nu sunt luate în considerare, ar putea duce la probleme mai mari în viitor.

Calitatea modelului de semințe va defini întotdeauna eficacitatea acestuia și cât de mult poate fi de încredere atunci când este utilizat în aplicații din viața reală: dacă modelul este defectuos, atunci răspunsul poate fi și el greșit.

Pe de altă parte, lipsa supravegherii umane ar putea duce la informații false presupuse ca intrări de încredere care vor produce răspunsuri greșite sau suboptime. Modelul ar putea oferi, de asemenea, un răspuns precis după ce a folosit o logică greșită.

În timp ce modelul pare să funcționeze bine în teorie, doar timpul va spune dacă poate îndeplini în mod fiabil sarcinile pe care le așteptăm să le facă.

Având în vedere ritmul dezvoltării AI, este posibil să nu fie nevoie să așteptăm foarte mult.

Noul Evaluator AI al META va transforma formarea de modele lingvistice mari, iată cum

Caracteristicile cheie ale evaluatorului autodidact

De ce este asta mare lucru?

Riscuri de implementare

Ce urmează pentru prețul acțiunilor Taylor Wimpey după reducerea plăților către investitori?

WTI și Brent scad pe Hyperliquid după suspendarea atacurilor SUA-Iran

Acțiuni CAC 40 de urmărit: LVMH, Kering, Hermes, Airbus, Société Générale

Acțiuni DAX de urmărit: Deutsche Bank, Adidas, BMW, Mercedes-Benz

CAC 40, FTSE MIB, IBEX 35 și DAX tensionate de creșterea randamentelor înainte de BCE