En compétition avec OpenAI, Google ne cesse de sortir de nouveaux modèles d’intelligence artificielle. Et si le grand public connaît surtout la famille de modèles Gemini, Google a également développé Gemma. Comme l’explique la firme, Gemma est une famille de modèles d’IA légers et performants, qui ont été conçus en utilisant les mêmes technologies que Gemini. La première version de Gemma a été présentée en février. Puis, en juin, Google a lancé Gemma 2 qui, à l’époque, était disponible avec 9 milliards de paramètres et 27 milliards de paramètres. La firme avait indiqué, à l’époque, que le modèle avec 27 milliards de paramètres dépasse tous les modèles de la même catégorie, et peut même rivaliser avec des modèles deux fois plus grands. Mais Google ne s’est pas arrêté là, puisque celui-ci vient de présenter une déclinaison de Gemma 2 avec 2 milliards de paramètres.
Un modèle d’IA mini mais très prometteur
L’intérêt de ce tout petit modèle d’IA est qu’il est possible de l’embarquer sur un grand nombre d’appareils, comme des ordinateurs portables, ou des appareils “périphériques”. À titre d’information, les smartphones haut de gamme qui utilisent le processeur Snapdragon 8 gen 3, par exemple, peuvent faire fonctionner localement une intelligence artificielle avec 10 milliards de paramètres. En d’autres termes, les modèles comme Gemma 2 2B ouvrent la voie à de nouveaux usages de l’intelligence artificielle générative. Pourtant, malgré sa petite taille, ce modèle serait extrêmement performant. Google indique que ce modèle d’IA très léger produit des résultats hors normes par rapport à sa taille, en apprenant des modèles plus grands, via une technique appelée “distillation”. “En fait, Gemma 2 2B surpasse tous les modèles GPT-3.5 sur la Chatbot Arena, démontrant ses capacités exceptionnelles d’IA conversationnelle”, indique la firme de Mountain View.
Pour rappel, GPT-3.5 est l’un des modèles qu’OpenAI propose gratuitement sur ChatGPT. Celui-ci tourne sur le cloud et nécessite donc une connexion à internet pour communiquer avec les serveurs d’OpenAI. Quant au Chatbot Arena évoqué par Google, il s’agit d’un système de classement des différents modèles d’IA, qui s’appuie sur des retours envoyés par les internautes sur les réponses données par les différents modèles d’IA.
L’IA embarquée, la solution idéale
Aujourd’hui, les chatbots comme Gemini ou ChatGPT sont accessibles gratuitement sur n’importe quel appareil qui dispose d’un navigateur. Cependant, le problème des modèles utilisés par ces chatbots est qu’ils tournent sur des serveurs et nécessitent donc une connexion internet. De plus, certains utilisateurs ou des entreprises peuvent avoir des réticences, à cause du fait que des données sont envoyées sur ces serveurs. Quant aux IA embarquées sur l’appareil (le smartphone ou le PC de l’utilisateur), elles fonctionnent sans connexion internet, sont plus rapides et permettent d’éviter l’envoi de données sensibles dans le cloud.
- Google poursuit ses recherches dans le domaine de l’IA générative
- Si le grand public connaît surtout Gemini, Google a aussi développé une famille de modèles baptisée Gemma
- Celui-ci vient de présenter Gemma 2 2B, un modèle assez petit pour tourner localement sur un PC, mais qui défierait GPT-3.5
- L’intérêt des modèles qui fonctionnent localement est que ceux-ci n’ont pas besoin de connexion internet et permettent d’éviter l’envoi de données sensibles dans le cloud
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.
