Passer au contenu

OpenAI muscle son IA génératrice de code informatique

Pendant que ChatGPT fait le buzz, OpenAI améliore également son IA Codex, un produit qui génère du code à partir d’instructions en langage naturel.

Ces derniers mois, la société OpenAI n’a cessé de faire le buzz grâce à son chatbot ChatGPT, capable de répondre aux questions en langage naturel des internautes, et tellement performante qu’il menace désormais Google. Mais ChatGPT n’est pas le seul produit en développement chez OpenAI. Et parmi les intelligences artificielles les plus prometteuses de l’entreprise, il y a Codex. On en parle moins, puisqu’il s’agit d’un produit spécifiquement créé pour les développeurs.

En effet, l’idée est de créer une IA capable de générer du code informatique à partir de demandes en langage naturel formulées par l’utilisateur. Et en matière de programmation, Codex pourrait avoir un impact important, puisqu’il permet aux entreprises et aux développeurs de créer des applications plus vite, ou avec moins de programmeurs. D’ailleurs, Codex est déjà en utilisation, puisqu’il s’agit de l’IA derrière la fonctionnalité Copilot de la plateforme Github de Microsoft (investisseur d’OpenAI).

La technologie derrière Copilot de GitHub

Sur Github, Copilot fonctionne un peu comme une autocomplétion, mais pour l’écriture de code. En tout cas, OpenAI est en train d’améliorer la technologie. Et selon un article publié par le site Semafor, celui-ci travaille avec une armée de développeurs contractants (et non des salariés) afin d’optimiser Codex. Aujourd’hui, OpenAI est une entreprise relativement petite par rapport aux géants de la tech, puisqu’elle ne compte que 375 salariés. Néanmoins, celui-ci compte énormément sur les contractants, pour la réalisation de certaines tâches nécessaires à l’entraînement de l’IA. Et justement, selon Semafor, OpenAI aurait récemment recruté 1 000 contractants, afin de muscler ses produits.

60 % de ces nouveaux contractants seraient chargés d’étiqueter des données pour alimenter des IA, tandis que 40 % seraient des programmeurs chargés d’entraîner Codex. En effet, alors que Codex était jusqu’à présent entraîné avec les données de GitHub, OpenAI voudrait aussi utiliser du code et des commentaires spécifiquement créés pour l’entraînement de l’intelligence artificielle. “Maîtrisant plus d’une douzaine de langages de programmation, Codex peut désormais interpréter des commandes simples en langage naturel et les exécuter au nom de l’utilisateur, ce qui permet de créer une interface en langage naturel pour les applications existantes”, peut-on lire dans la description de Codex par OpenAI.

Pour fournir du code et des commentaires

Selon un développeur cité par Semafor, lors du test d’OpenAI, on lui aurait d’abord donné un problème à résoudre avec du code, et il devait écrire en anglais comment il compte aborder ce problème. Puis, dans une seconde phase, il a écrit le code. Et lorsqu’un bug est détecté sur ce code, on lui a demandé de rédiger du texte sur ce bug, et sur comment le code doit être corrigé. “Ils veulent très probablement alimenter ce modèle avec un type très spécifique de données de formation, où l’humain fournit une présentation étape par étape de leur processus de pensée”, a également expliqué le développeur, cité par Semafor.

Bien entendu, l’info n’est pas officielle. Mais il est à noter que ce n’est pas un secret qu’OpenAI compte sur les contractants pour réaliser ce genre de tâche lors du développement de ses modèles. Dans un article scientifique publié en 2022, par exemple, l’entreprise a remercié ces contractants. “Enfin, nous tenons à remercier tous nos sous-traitants pour avoir fourni les données essentielles à la formation des modèles”, pouvait-on lire dans cette publication.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter 🍋

Abonnez-vous, et recevez chaque matin un résumé de l’actu tech

Cliquer pour commenter
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *