Il est aujourd’hui communément admis que les systèmes d’IA peuvent répondre des énormités à leurs utilisateurs. Entre les pizzas à la colle de AI Overview (Google), les réponses gênantes de Prometheus (Microsoft) et les fausses informations que se permet de produire ChatGPT à certains moments, ceux-ci sont loin d’être parfaits. Même si ces hallucinations sont de moins en moins courantes, OpenAI a décidé de s’attaquer de front au problème en développant une IA, CriticGPT, pour corriger ChatGPT. Le serpent qui se mord la queue ?
CriticGPT : un œil vigilant sur le code
Ce nouveau système repose bien évidemment sur le même modèle de langage que ChatGPT-4, mais est spécialisé pour déceler les imperfections dans les réponses du chatbot. Il analyse méticuleusement les lignes de codes et fait remonter ensuite les erreurs potentielles, soulageant ainsi le travail des réviseurs de chair et d’os.
Cette avancée s’inscrit dans une démarche plus large visant à aligner davantage les systèmes d’IA sur les attentes humaines, notamment grâce à l’apprentissage par renforcement issu des retours d’expérience humains (Reinforcement Learning from Human Feedback). Une étude récente, intitulée LLM Critics Help Catch LLM Bugs, révèle que CriticGPT a été entraîné sur un ensemble de données parsemé d’erreurs intentionnelles, affinant ainsi sa capacité à identifier et à signaler une myriade de bugs de programmation.
Les résultats sont éloquents : dans 63 % des cas impliquant des erreurs naturelles des modèles de langage, les critiques formulées par CriticGPT ont été plébiscitées par les évaluateurs humains, surpassant celles générées par d’autres IA ou même par des experts humains seuls. Une collaboration homme-machine qui semble fonctionner à merveille.
Un expert avisé, mais encore imparfait
CriticGPT va même encore plus loin. Lors d’expérimentations pointues, le modèle a été confronté à un échantillon de données d’entraînement de ChatGPT, préalablement jugé irréprochable par des experts humains. Contre toute attente, CriticGPT a décelé des anomalies dans près d’un quart des cas, anomalies ultérieurement corroborées par les réviseurs. Ses compétences vont donc au-delà du domaine du code et CriticGPT peut même identifier des erreurs subtiles qui échapperaient à l’œil d’un expert humain.
Dans leur quête d’excellence, les chercheurs ont conçu une technique novatrice baptisée Force Sampling Beam Search (FSBS). Cette méthode ingénieuse permet d’ajuster avec précision la rigueur de CriticGPT dans sa traque des imperfections, tout en maîtrisant la fréquence des faux positifs. C’est un algorithme qui préfère explorer des pistes moins probables pour générer une réponse plutôt que de s’orienter vers le choix le plus évident.
Malgré les avancées remarquables qu’il propose, CriticGPT n’est pas exempt de certaines limitations inhérentes à sa conception. En effet, son apprentissage s’est principalement focalisé sur l’analyse de réponses succinctes générées par ChatGPT, ce qui pourrait s’avérer insuffisant pour appréhender des tâches d’une envergure et d’une complexité supérieures. Par ailleurs, bien que CriticGPT parvienne à atténuer considérablement les erreurs, il ne parvient pas encore à les éliminer totalement. Ainsi, les experts humains chargés de la révision demeurent susceptibles de commettre des erreurs d’appréciation en se fiant à ces données parfois erronées. Prochaine étape : la création d’un nouveau modèle de langage pour faire la chasse aux erreurs de CriticGPT après ses corrections apportées aux réponses de ChatGPT ? Allez savoir !
- CriticGPT est un nouveau système d’IA conçu pour traquer les erreurs de codes de ChatGPT.
- Son usage permet d’analyser et de signaler les erreurs dans les réponses produites par le chatbot qui ont échappé à la correction humaine.
- Même s’il s’avère efficace, il reste encore imparfait et limité.
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.
Et ensuite une 3eme pseudo IA pour surveiller la seconde ?
Et ainsi de suite.
Même chez les IA : quand chacune surveille et corrige l’autre, elles se fascisent. Tout va bien pour les humains, on a encore une petite longeur d’avance.