Passer au contenu

Portrait – 6 infos clés sur Andrej Karpathy, le talent que tout l’écosystème de l’IA s’arrache (il vient de choisir Anthropic)

Qui est vraiment le génie de l’ombre que s’arrachent Elon Musk, Sam Altman et désormais, Anthropic ? D’expert mondial du Rubik’s Cube à bâtisseur des IA les plus puissantes de la planète, découvrez la trajectoire hors norme d’Andrej Karpathy, l’homme qui redéfinit l’avenir du code.

À seulement 39 ans, Andrej Karpathy est l’une des figures les plus influentes et respectées de l’histoire moderne de l’intelligence artificielle (IA). Et il a secoué la Silicon Valley le mardi 19 mai 2026, lorsqu’on a appris qu’il rejoignait Anthropic. C’est un recrutement XXL pour la maison mère de Claude, qui lui confère un avantage clair dans la guerre impitoyable que se livrent les géants de la tech pour attirer les cerveaux d’élite.

Intégré à l’équipe de recherche sur le pré-entraînement, Karpathy va piloter une toute nouvelle entité. Son objectif : utiliser les modèles Claude pour accélérer et optimiser l’acquisition des connaissances fondamentales des futures IA, en s’appuyant sur l’orchestration intelligente plutôt que sur la seule débauche de puissance de calcul et de puces graphiques.

Afin de comprendre pourquoi le monde de la tech retient son souffle face à cette nomination, il faut se plonger dans la trajectoire hors norme d’un homme qui a façonné, à lui seul, certains des plus grands bouleversements algorithmiques de notre époque.

Ses mentors sont des pointes de l’IA

Andrej Karpathy voit le jour en octobre 1986 à Bratislava, en Tchécoslovaquie, avant d’immigrer avec sa famille à Toronto à l’âge de 15 ans. C’est à l’université de cette même ville qu’il obtient sa licence en informatique et physique en 2009. C’est là, aussi, qu’il assiste aux cours de Geoffrey Hinton, pionnier des réseaux de neurones artificiels, considéré comme l’un des trois parrains de l’IA. Après un master à l’université de la Colombie-Britannique axé sur la simulation physique de mouvements, il s’envole pour Stanford afin d’y préparer son doctorat.

En parallèle de ses études, Karpathy se fait remarquer dès 2006 sur YouTube sous le pseudonyme badmephisto. Ses tutoriels ultra-détaillés sur la résolution du Rubik’s Cube cumulent des millions de vues et forment les meilleurs spécialistes mondiaux, lui-même étant capable de résoudre le puzzle en 17 secondes.

À Stanford, sous la direction de Fei-Fei Li, sa thèse explore l’intersection de la vision par ordinateur et du langage naturel. Pour tester les limites du modèle de deep learning ImageNet, Karpathy décide de s’entraîner pendant des semaines à classifier manuellement des milliers d’images. En atteignant un taux d’erreur de 5,1 %, il établit la « ligne de base humaine », s’apercevant que les algorithmes naissants égalent déjà la mémoire humaine sur des tâches visuelles complexes.

L’homme qui a appris le deep learning à toute une génération

Parallèlement à ses recherches doctorales, Karpathy devient en 2015 le concepteur et l’instructeur principal du tout premier cours de deep learning de Stanford : le fameux CS 231n (Convolutional Neural Networks for Visual Recognition). Ce cursus devient immédiatement un pilier de l’université. À tel point que les inscriptions passent de 150 étudiants en 2015 à plus de 750 en 2017. Les notes de cours et les conférences, partagées en ligne, s’imposent comme la porte d’entrée de référence pour toute une génération de futurs ingénieurs de la Silicon Valley.

Durant cette période d’effervescence académique, Karpathy valide ses compétences théoriques par trois stages stratégiques au sein des laboratoires les plus pointus de l’époque. Il passe ainsi par Google Brain en 2011, par Google Research en 2013 pour travailler sur l’apprentissage supervisé appliqué aux vidéos YouTube, et enfin par DeepMind en 2015, au sein de l’équipe de reinforcement learning. Ces expériences lui permettent de manipuler des infrastructures de calcul à grande échelle bien avant la démocratisation massive de l’IA.

Intelligence Artificielle Generative
© Chaosamran_Studio / Shutterstock.com

Cofondateur d’OpenAI

En décembre 2015, Andrej Karpathy devient l’un des 11 membres fondateurs d’OpenAI. Aux côtés de figures comme Ilya Sutskever, Greg Brockman, Sam Altman et Elon Musk, il intègre le laboratoire de recherche initialement structuré comme une organisation à but non lucratif, dont la mission affichée est de développer une intelligence artificielle générale (AGI) bénéfique pour l’humanité.

En tant que chercheur scientifique, Karpathy y mène des travaux pionniers sur l’apprentissage profond appliqué aux modèles génératifs et au deep reinforcement learning. Il développe notamment PixelCNN++, un modèle optimisé pour la génération d’images au niveau des pixels. Il conçoit également des agents autonomes capables d’utiliser un clavier et une souris pour accomplir des tâches complexes sur des interfaces web.

Sa contribution active, qui dure deux années, contribue à structurer l’excellence technique et la culture de recherche de la jeune pousse.

Openai Nucleaire
© Samuel Boivin / Shutterstock.com

Le pari fou chez Tesla

En juin 2017, la trajectoire d’Andrej Karpathy prend un tournant industriel majeur. Elon Musk le recrute personnellement pour devenir le directeur de l’intelligence artificielle et de la vision de l’Autopilot chez Tesla. Dans un courriel divulgué récemment lors du procès Musk contre Altman, le patron de Tesla justifiait ce débauchage, qui avait rendu les équipes d’OpenAI furieuses, en qualifiant Karpathy de « numéro 2 mondial de la vision par ordinateur », juste derrière Ilya Sutskever.

À la tête d’une équipe dédiée, il prend en charge l’étiquetage des données, l’entraînement des réseaux de neurones et le déploiement sur les puces sur mesure de Tesla. Karpathy devient l’architecte du pari le plus controversé de l’industrie automobile : contrairement à ses concurrentes, Tesla refuse d’utiliser les capteurs Lidar pour la conduite autonome, jugés trop coûteux. Le constructeur ne s’appuie que sur des caméras.

Sous sa direction, les ingénieurs conçoivent une architecture réseau révolutionnaire capable de fusionner en temps réel les flux vidéo de 8 caméras tout en mémorisant les images précédentes. Karpathy prouve la viabilité technique de ce modèle en exploitant les données issues de millions de véhicules en circulation, puis quitte l’entreprise en juillet 2022.

Tesla Model Y
© Tesla

L’acte 2 chez OpenAI et la naissance d’Eureka Labs

Après une année sabbatique consacrée à la création de contenus techniques, Andrej Karpathy officialise son retour chez OpenAI en février 2023, en plein essor planétaire de ChatGPT. Durant ce second passage, il monte et dirige une équipe spécialisée dans la génération de données synthétiques. Ses travaux s’avèrent cruciaux pour le développement de GPT-4, marquant une rupture technologique majeure grâce à ses capacités multimodales capables de traiter simultanément du texte et des images.

Fidèle à sa volonté d’indépendance, il quitte à nouveau le navire un an plus tard, en février 2024. En juillet de la même année, il lance sa propre startup baptisée Eureka Labs. Pensée comme une plateforme éducative nativement conçue pour l’ère de l’IA, l’entreprise ambitionne de jumeler l’excellence pédagogique humaine à des assistants virtuels capables de guider les élèves.

En parallèle, sa série de vidéos gratuites Zero to Hero et son cours LLM101n s’imposent comme des références mondiales pour comprendre les fondations des grands modèles de langage.

Chatgpt
© Primakov / Shutterstock.com

Il a théorisé le vibe coding

À la fin de l’année 2025, Andrej Karpathy bouscule une nouvelle fois les certitudes de l’industrie en théorisant l’avènement du vibe coding. À travers une série de publications très commentées, il confie ne plus écrire de code de manière traditionnelle, mais dicter ses intentions à des modèles d’IA pour superviser la génération automatique de programmes complexes. Selon lui, l’ingénierie logicielle bascule vers un rôle d’orchestration où la maîtrise du langage naturel remplace la syntaxe informatique.

Désormais, en prenant les rênes d’une équipe dédiée à l’accélération de la recherche grâce aux modèles Claude, Karpathy fait face à un immense défi : prouver que l’IA peut optimiser son propre apprentissage de manière autonome et sécurisée.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Newsletter 🍋

Abonnez-vous, et recevez chaque matin un résumé de l’actu tech