Il nuovo AI Evaluator di META trasformerà la formazione di modelli linguistici di grandi dimensioni, ecco come

Il nuovo AI Evaluator di META trasformerà la formazione di modelli linguistici di grandi dimensioni, ecco come
Harsh Vardhan
22 ott 2024, 19:53 PM
  • Il modello sfrutta l'apprendimento autonomo, assegnando e valutando compiti in corso d'opera per migliorare i risultati.
  • Elimina la necessità dell'intervento umano nelle varie fasi di sviluppo del modello di intelligenza artificiale.
  • Solo il tempo ci dirà se l'addestramento dei sistemi di intelligenza artificiale utilizzando altri sistemi di intelligenza artificiale si rivelerà efficace.

Solo due mesi fa, il CEO di OpenAI, Sam Altman, ha affermato che addestrare l'intelligenza artificiale su dati sintetici (ovvero dati generati dall'intelligenza artificiale) potrebbe portare a modelli di intelligenza artificiale inaffidabili.

L'ultimo valutatore di intelligenza artificiale di META, annunciato nello stesso periodo, è già pronto a dimostrare che Altman si sbaglia.

Il valutatore AI autodidatta di Meta è progettato per agevolare lo sviluppo di modelli linguistici di grandi dimensioni, consentendo loro di autovalutarsi e automigliorarsi senza intervento umano.

Attualmente, il miglioramento degli LLM richiede un processo inefficiente in cui personale qualificato verifica l'accuratezza delle risposte, il che aumenta notevolmente i tempi e i costi di adozione.

Inoltre, il processo richiede dati generati dall'uomo, dati disponibili solo in quantità finita.

Il nuovo modello di META è ora in grado di generare dati che possono essere utilizzati per addestrare altri modelli di intelligenza artificiale, il che significa che un problema è già stato risolto.

Significa anche che non saranno necessari esseri umani per supervisionare la qualità dei dati immessi nei modelli di IA. Anche di questo si occuperà il valutatore di IA.

Caratteristiche principali del Valutatore autodidatta

Il nuovo modello presenta due caratteristiche principali che potrebbero trasformare il settore dell'intelligenza artificiale.

Innanzitutto, utilizza una funzione di apprendimento autonomo per generare attività e valutarne l'esecuzione, eliminando la necessità di personale qualificato per verificare i dati utilizzati e le risposte fornite per risolvere il compito in questione.

Ciò riduce i tempi e i costi associati allo sviluppo e al miglioramento dei modelli, garantendo scalabilità, un requisito fondamentale per le aziende che hanno bisogno di utilizzare i modelli su più piattaforme e per le esigenze di diversi utenti.

Inoltre, questa ridotta partecipazione umana riduce anche il potenziale bias introdotto nel modello dagli esseri umani.

In secondo luogo, si utilizza una tecnica di ragionamento chiamata “Catena di pensieri” per emulare il ragionamento umano fornendo una serie di passaggi intermedi verso la risoluzione di compiti complessi, invece di fornire una risposta diretta.

Per questo motivo, il modello può imparare dai ragionamenti efficaci utilizzati in precedenza per risolvere problemi simili.

Perché è un problema così grande?

Essere in grado di generare dati sintetici per addestrare e valutare altri modelli di intelligenza artificiale è di fondamentale importanza per le aziende che desiderano utilizzare l'intelligenza artificiale nell'assistenza clienti, nella formazione dei dipendenti o nell'analisi legale.

Ad esempio, se utilizzato in un chatbot di assistenza clienti, il modello può scomporre il problema in una serie di passaggi più piccoli per verificare le possibili cause del problema e guidare il cliente nella ricerca di una soluzione.

In un altro scenario, il modello può decostruire le regole e le procedure interne di un'azienda per migliorare il programma di formazione per i nuovi dipendenti.

Le aziende possono adattare rapidamente questi modelli alle proprie esigenze senza prima dover creare un proprio modello, cosa che hanno dovuto fare finora.

Rischi di implementazione

L'implementazione di tali sistemi di intelligenza artificiale presenta rischi e sfide che, se non considerati, potrebbero causare problemi ancora più ingenti in futuro.

La qualità del modello seed definirà sempre la sua efficacia e il suo grado di affidabilità quando utilizzato in applicazioni reali: se il modello è imperfetto, allora anche la risposta potrebbe esserlo.

D'altro canto, una mancanza di supervisione umana potrebbe portare a false informazioni considerate input affidabili che produrranno risposte sbagliate o subottimali. Il modello potrebbe anche fornire una risposta accurata dopo aver utilizzato la logica sbagliata.

Anche se in teoria il modello sembra funzionare bene, solo il tempo ci dirà se riuscirà a svolgere in modo affidabile i compiti che ci aspettiamo.

Considerando il ritmo dello sviluppo dell'intelligenza artificiale, potremmo non dover aspettare molto a lungo.