OpenAI va lancer des modèles Open-Weight : ce qu’ils sont et pourquoi cela change tout

  • GPT-OSS-120B et 20B sont les premiers modèles ouverts d’OpenAI en six ans.
  • Commercialisé sous Apache 2.0, permettant une utilisation, une modification et un déploiement complets.
  • Les modèles rivalisent avec les modèles GPT propriétaires en termes de raisonnement, de codage et de références mathématiques.

OpenAI vient de faire quelque chose qu’il n’a pas fait depuis des années : il a publié des modèles de langage open source.

La dernière fois que cela s’est produit, c’était avec GPT-2 en 2019. Maintenant, nous en avons deux nouveaux : gpt-oss-120b et gpt-oss-20b.

Qu’est-ce qui est différent cette fois-ci ? Ils sont publiés sous la licence Apache 2.0, ce qui signifie essentiellement que n’importe qui peut les utiliser, les modifier et les exécuter comme il le souhaite. C’est une décision assez inattendue de la part d’une entreprise qui a principalement gardé les choses fermées ces derniers temps.

Que sont les modèles Open-Weight ?

Les modèles à poids ouvert sont des systèmes d’IA où les « poids » réels, les numéros de base que le modèle a appris pendant l’entraînement, sont rendus publics. Ces poids sont à l’origine des prédictions, des réponses et du comportement général du modèle.

Contrairement aux modèles fermés comme GPT-4 ou Claude, auxquels vous ne pouvez accéder que via des API ou des services Web, les modèles à poids ouvert donnent aux utilisateurs une réelle liberté. Les utilisateurs peuvent :

  • Téléchargez-les et exécutez-les sur votre propre matériel, qu’il s’agisse d’un PC personnel, d’un serveur de bureau ou même d’un téléphone
  • Affinez-les avec vos propres données pour obtenir de meilleurs résultats pour des tâches spécifiques
  • Jetez un coup d’œil sous le capot et jouez avec l’architecture du modèle lui-même
  • Utilisez-les comme vous le souhaitez, sans avoir à payer pour y accéder ou à dépendre d’une plateforme tierce

Cela dit, « open-weight » ne signifie pas entièrement open-source. Les utilisateurs obtiennent les poids du modèle, mais pas toujours le code d’entraînement ou l’ensemble des données utilisé pour le construire.

Il s’agit donc d’un compromis car les utilisateurs obtiennent le contrôle et la transparence, mais les entreprises gardent toujours certaines parties du processus de formation privées, souvent pour des raisons de propriété ou de sécurité.

Pourquoi la décision d’OpenAI va-t-elle tout changer ?

Jusqu’à présent, les modèles les plus puissants d’OpenAI étaient enfermés derrière des API payantes, uniquement accessibles aux grandes entreprises ou aux utilisateurs bien financés. La société a invoqué des problèmes de sécurité, mais le résultat a été un accès limité pour l’ensemble de la communauté des développeurs et des chercheurs.

Cela est en train de changer. Avec la sortie de modèles à poids ouvert, OpenAI donne aux développeurs indépendants, aux chercheurs et aux startups les outils nécessaires pour exécuter une IA de pointe localement, que ce soit pour des raisons de confidentialité, d’économies ou simplement pour la liberté de bricoler.

Ces modèles peuvent être affinés pour tout, du conseil juridique et du soutien médical aux langues régionales et aux tâches de codage spécialisées.

Pas besoin d’attendre l’autorisation ou les mises à jour d’une équipe centrale, les utilisateurs peuvent personnaliser et déployer selon leurs propres conditions.

C’est aussi une victoire pour la transparence. Les poids ouverts permettent aux chercheurs d’approfondir le fonctionnement des modèles, de tester les biais et de vérifier les problèmes de sécurité. Ce type de visibilité renforce la confiance.

Cette décision est également observée en réponse à la concurrence croissante de Meta, Mistral et DeepSeek. Mais quelle que soit la raison, le résultat est le même : plus de personnes, dans plus d’endroits, peuvent désormais exploiter une puissante technologie d’IA et construire des choses qui n’étaient pas possibles auparavant.

Comment accéder aux modèles Open-Weight ?

OpenAI a rendu ses derniers modèles téléchargeables gratuitement sur Hugging Face et GitHub. Ils fonctionnent sur du matériel doté de 16 à 80 Go de mémoire et sont entièrement personnalisables, idéaux pour des tâches telles que le raisonnement, le suivi d’instructions et l’exécution de code, et affinés pour des industries ou des langages spécifiques.

En publiant ouvertement ces modèles, OpenAI transfère le pouvoir d’une poignée de grandes entreprises technologiques aux développeurs, aux startups et aux chercheurs du monde entier.

Cela signifie une innovation plus rapide, des tests de sécurité plus solides et plus d’expérimentations plus tôt. Les chercheurs peuvent désormais inspecter le fonctionnement des modèles, trouver des biais ou créer de nouvelles fonctionnalités sans attendre la feuille de route de quelqu’un d’autre.