Le nouvel évaluateur d'IA de META va transformer la formation de grands modèles linguistiques, voici comment

Le nouvel évaluateur d'IA de META va transformer la formation de grands modèles linguistiques, voici comment
Harsh Vardhan
22 oct. 2024, 19:53 PM
  • Le modèle utilise l'apprentissage autonome, en donnant et en évaluant des tâches à la volée pour améliorer les résultats.
  • Il élimine le besoin d’intervention humaine à différentes étapes du développement du modèle d’IA.
  • Le temps nous dira si la formation de systèmes d’IA utilisant d’autres systèmes d’IA s’avérera fructueuse.

Il y a à peine deux mois, le PDG d'OpenAI, Sam Altman, déclarait que la formation de l'IA sur des données synthétiques (c'est-à-dire des données générées par l'IA) pourrait conduire à des modèles d'IA peu fiables.

Le plus récent évaluateur d'IA de META, annoncé au même moment, est déjà déterminé à prouver qu'Altman a tort.

L'évaluateur d'IA autodidacte de Meta est conçu pour aider au développement de grands modèles linguistiques en leur permettant de s'auto-évaluer et de s'auto-améliorer sans intervention humaine.

Actuellement, l’amélioration des LLM nécessite un processus inefficace dans lequel des humains qualifiés vérifient l’exactitude des réponses, ce qui augmente considérablement les délais et les coûts d’adoption.

De plus, le processus nécessite des données générées par l’homme, qui ne sont disponibles qu’en quantité limitée.

Le nouveau modèle de META peut désormais générer des données qui peuvent être utilisées pour former d’autres modèles d’IA, ce qui signifie qu’un problème est déjà résolu.

Cela signifie également que les humains ne seront plus nécessaires pour contrôler la qualité des données transmises aux modèles d'IA. L'évaluateur de l'IA s'en chargera également.

Principales caractéristiques de l'évaluateur autodidacte

Le nouveau modèle présente deux caractéristiques principales qui pourraient transformer le secteur de l’IA.

Tout d’abord, il utilise une fonction d’apprentissage autonome pour générer des tâches et évaluer leurs performances, éliminant ainsi le besoin de recourir à des humains qualifiés pour vérifier les données utilisées et les réponses données pour résoudre la tâche à accomplir.

Cela réduit le temps et les coûts associés au développement et à l'amélioration des modèles, apportant ainsi l'évolutivité, une exigence clé des entreprises qui doivent utiliser les modèles sur plusieurs plates-formes et pour répondre aux besoins de différents utilisateurs.

De plus, cette participation humaine réduite réduit également le biais potentiel introduit dans le modèle par les humains.

Deuxièmement, une technique de raisonnement par « chaîne de pensée » est utilisée pour imiter le raisonnement humain en fournissant une série d’étapes intermédiaires pour résoudre des tâches complexes, au lieu de fournir une réponse directe.

Pour cela, le modèle peut apprendre de raisonnements antérieurs réussis utilisés pour résoudre des problèmes similaires.

Pourquoi est-ce si important ?

Être capable de générer des données synthétiques pour former et évaluer d’autres modèles d’IA est un enjeu majeur pour les entreprises qui souhaitent utiliser l’IA dans le support client, la formation des employés ou l’analyse juridique.

Par exemple, utilisé dans un chatbot de support client, le modèle peut décomposer le problème en une série d'étapes plus petites pour vérifier les causes possibles du problème et guider le client dans la recherche d'une solution.

Dans un autre scénario, le modèle peut déconstruire les règles et procédures internes d’une entreprise pour améliorer le programme de formation des nouveaux employés.

Les entreprises peuvent rapidement adapter ces modèles à leurs propres besoins sans avoir à construire au préalable leur propre modèle, ce qu’elles ont dû faire jusqu’à présent.

Risques de mise en œuvre

La mise en œuvre de tels systèmes d’IA comporte des risques et des défis qui, s’ils ne sont pas pris en compte, pourraient entraîner des problèmes plus importants à l’avenir.

La qualité du modèle de départ définira toujours son efficacité et la fiabilité de celui-ci lorsqu’il est utilisé dans des applications réelles : si le modèle est défectueux, la réponse peut également l’être.

D'un autre côté, un manque de surveillance humaine pourrait conduire à des informations fausses considérées comme fiables, qui produiront des réponses erronées ou sous-optimales. Le modèle pourrait également donner une réponse précise après avoir utilisé une logique erronée.

Bien que le modèle semble bien fonctionner en théorie, seul le temps nous dira s’il peut effectuer de manière fiable les tâches que nous attendons de lui.

Compte tenu du rythme de développement de l’IA, nous n’aurons peut-être pas à attendre très longtemps.