Passer au contenu

Ce rival gratuit de ChatGPT a quelque chose en plus

La société américaine Databricks vient de publier Dolly 2.0, un modèle de langage accessible gratuitement.

  • Un nouveau modèle de langage du nom de Dolly est accessible gratuitement et en open source
  • Entraîné par des humains et doté d’une base de données intégrant plusieurs milliards de paramètres, il pourrait faire de l’ombre à ChatGPT
  • On peut aussi penser qu’il s’agit d’un point de départ. Le fait qu’il soit en open source peut donner lieu à d’autres initiatives fructueuses

On vient peut-être d’assister à un nouveau tournant dans la course à l’IA. La société américaine Databricks a en effet lancé ce mercredi un nouveau modèle de langage baptisé Dolly 2.0. Ce qui distingue ce dernier de concurrents tels que ChatGPT ou Bing Chat, c’est qu’il est accessible gratuitement et que l’API est open source.

De fait, ce générateur de langage semble extrêmement prometteur. Avec ses 12 milliards de paramètres intégrés, il repose sur le modèle pythia d’EleutherAI. Et pour s’assurer que l’IA propose des réponses adaptées aux utilisateurs, Databricks a mis ses employés à contribution en les faisant participer à un concours en interne.

Un point de départ pour libérer l’IA

5000 collaborateurs ont étalonné cet outil en lui posant des questions fermées, ouvertes, en lui faisant travailler sur des exercices d’écriture créative, ou encore en tant qu’assistant et aide au brainstorming.

Sur son blog, la compagnie ne tarit pas d’éloges sur son initiative : « À notre connaissance, ce jeu de données est le premier jeu de données d’instruction à source ouverte généré par l’homme et spécifiquement conçu pour que de grands modèles de langage présentent l’interactivité magique de ChatGPT.»

Si le lancement de Dolly reste relativement confidentiel auprès du grand public, les spécialistes de l’IA sont quant à eux très enthousiastes. À l’image du chercheur Simon Willison qui a confié à nos confrères d’ArsTechnica : « Même si Dolly 2 n’est pas bon, je m’attends à ce que nous voyions bientôt un tas de nouveaux projets utilisant ces données d’entraînement. Et certains d’entre eux pourraient produire quelque chose de vraiment utile. »

Difficile de dire quelle sera la suite, mais on pourrait donc avoir affaire un changement majeur. On peut en tout cas noter que la course à l’IA rebat un peu les cartes et que des entreprises comme Databricks, qui ne jouaient pas dans la même cour que les GAFAM, tentent de tirer leur épingle du jeu. Cela dit, les géants de la Tech ont une masse financière et des ressources suffisantes pour contre attaquer, et les initiatives de Google, Microsoft, et Meta sont là pour en attester.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter 🍋

Abonnez-vous, et recevez chaque matin un résumé de l’actu tech