Passer au contenu

Mistral, le concurrent français d’OpenAI, franchit une nouvelle étape importante

La startup française Mistral a publié un nouveau modèle baptisé Pixtral 12B. Il s’agit de sa première technologie multimodale, capable de comprendre les images.

Aujourd’hui, la startup française Mistral fait partie des startups spécialisées dans l’IA les plus prometteuses dans le monde. Valorisée à plus de 6 milliards de dollars, suite à une levée de fonds au mois de juin, Mistral développe des modèles d’IA similaire à ceux exploités par ChatGPT. Et cette semaine, la startup vient de franchir une nouvelle étape dans son développement, en sortant Pixtral 12B. En effet, alors que ses précédents modèles n’étaient capables de traiter que du texte, Pixtral 12B est le premier modèle multimodal de l’entreprise.

Une IA capable de comprendre les images

Une fois de plus, Mistral s’est contenté de publier un lien “magnet” (un lien de téléchargement en peer-to-peer) sur le réseau social X. Mais d’après les explications du site TechCrunch, Pixtral 12B serait basé sur un autre modèle de Mistral baptisé Nemo 12B, avec 12 milliards de paramètres. Cependant, alors que Nemo 12B ne traite que du texte, Pixtral 12B est capable de traiter à la fois du texte et des images. Ce nouveau modèle peut donc répondre à des questions qui incluent des images.

Et si Mistral ne donne pas d’indications sur les capacités de son nouveau modèle, TechCrunch explique que Pixtral 12B devrait, en théorie, être capable de créer des légendes pour une image ou encore de compter des objets sur une photo, comme le modèle GPT-4o d’OpenAI. En tout cas, le fait que Mistral soit capable de créer des modèles multimodaux est très important, car cela va étendre les usages potentiels de sa technologie.

Un modèle sous licence Apache 2.0

Par ailleurs, alors que d’autres laboratoires d’IA opèrent de manière fermée, Mistral continue de partager ses technologies gratuitement. TechCrunch a pu confirmer auprès d’un représentant de Mistral que le modèle Pixtral 12B peut être téléchargé et modifié en respectant la licence Apache 2.0.

Pour rappel, l’entreprise Meta a adopté une approche similaire, en partageant ses modèles Llama en open source.

  • Parmi les entreprises les plus prometteuses dans le domaine de l’intelligence artificielle générative, il y a la startup française Mistral
  • Celle-ci a déjà publié de nombreux modèles similaires à ceux de ChatGPT, mais Pixtral 12B, qui a été publié cette semaine, est le premier modèle multimodal de Mistral
  • En plus de comprendre les textes, Pixtral 12B comprend aussi les images
  • Ce modèle est distribué en utilisant la licence Apache 2.0, il peut être téléchargé et modifié

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter 🍋

Abonnez-vous, et recevez chaque matin un résumé de l’actu tech