Passer au contenu

La nouvelle IA de la pépite française Mistral est tout simplement impressionnante

Elle pourrait révolutionner les opérations des entreprises.

Mistral AI, le champion français de l’IA générative qui pèse 6 milliards de dollars, annonce le lancement d’un modèle OCR (Optical Character Recognition). Le potentiel pour les entreprises qui l’adoptent est immense.

Un « must have » pour les entreprises

Car cette technologie, qui existe depuis les années 1950, permet de reconnaître et d’extraire du texte à partir d’images ou de documents numérisés. Elle convertit des documents non structurés, comme des PDF ou des images, en données structurées, facilitant ainsi la recherche et l’analyse. Or, « environ 90 % des données organisationnelles mondiales sont stockées sous forme de documents », indique Mistral dans un communiqué, et elle entend faciliter leur exploitation avec Mistral OCR.

« Tout au long de l’histoire, les progrès de l’abstraction et de la recherche d’informations ont été le moteur du progrès humain. Des hiéroglyphes aux papyrus, de la presse à imprimer à la numérisation, chaque avancée a rendu le savoir humain plus accessible et plus exploitable, alimentant ainsi l’innovation », écrit la jeune pousse.

Cette API multimodale, accessible via la suite dédiée aux développeurs La Plateforme et via les partenaires cloud de Mistral, est en mesure d’extraire tout le contenu de documents non structurés. Elle peut aussi détecter la présence d’illustrations et de photos entrelacées avec des blocs de texte, pour ensuite créer des délimitations autour de ces éléments graphiques. Au final, l’ensemble des documents est disponible de manière structurée, organisé de manière ultra précise. Selon un benchmark, ses capacités sont plus poussées que les autres modèles sur le marché.

Mistral Ai
© Poetra.RH / Shutterstock.com

Pour quels usages ?

Mistral OCR pourrait s’avérer précieux pour les entreprises qui veulent développer leurs propres modèles de langage (LLM). Car ils requièrent ce type de données pour leur entraînement : il est extrêmement important de stocker et d’indexer les données dans un format propre afin qu’elles puissent être réutilisées pour le traitement de l’IA.

« Il s’agit d’une étape cruciale vers l’adoption généralisée des assistants d’IA dans les entreprises qui ont besoin de simplifier l’accès à leur vaste documentation interne », commente Guillaume Lample, cofondateur et directeur scientifique de Mistral.

En outre, le modèle automatise le traitement des documents, ce qui peut réduire les tâches administratives manuelles. Il peut également analyser rapidement les rapports, contrats ou documents financiers, en plus de comparer le contenu de plusieurs documents. Mistral OCR permet aussi d’interagir avec les documents grâce à des commandes textuelles, et a vocation à améliorer l’expérience client en optimisant les bases de connaissances internes.

  • Mistral AI lance Mistral OCR, une IA multimodale capable de structurer les données.
  • Les cas d’usage pour les entreprises sont multiples et promettent un gain de temps considérable.
  • Le modèle est disponible via La Plateforme et au travers des partenaires cloud de Mistral.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter 🍋

Abonnez-vous, et recevez chaque matin un résumé de l’actu tech