Passer au contenu

Coup de tonnerre dans le monde de l’IA : le cofondateur d’OpenAI rejoint les rangs d’Anthropic

Andrej Karpathy, cofondateur d’OpenAI, rejoint officiellement Anthropic, la start-up d’IA derrière Claude. Il vient de rejoindre l’équipe en charge de l’apprentissage des grands modèles d’IA, une étape clé pour façonner l’intelligence artificielle. Karpathy rejoint la concurrence alors que la rivalité entre OpenAI et Anthropic atteint son paroxysme.

Andrej Karpathy, l’un des grands noms de l’IA, vient d’annoncer son arrivée chez Anthropic. Dans un court message publié sur sa page X, l’ingénieur d’origine slovaco‑canadienne explique être persuadé que « les prochaines années à la pointe des LLM (NDLR : large language model, soit grand modèle de langage en français) seront particulièrement formatrices ». Il se dit ravi d’intégrer l’équipe et de reprendre ses activités de « recherche et de développement ».

L’homme est surtout connu comme le cofondateur d’OpenAI. Il a ainsi participé à la création de ChatGPT, l’une des IA les plus connues au monde. Après avoir fondé OpenAI, il était ingénieur chez Tesla. Sous les ordres d’Elon Musk, Karpathy a supervisé le développement visuel de l’Autopilot. Ce n’est pas tout. Entre‑temps, il a consacré deux ans à l’éducation et à la vulgarisation de l’IA par le biais de sa propre entreprise, Eureka Labs.

À lire aussi : Anthropic se tourne vers SpaceX pour doubler les débits de Claude, mais il y a un piège

Un rôle clé chez Anthropic

En rejoignant Anthropic, le chercheur retourne à son premier amour : la recherche. Spécialiste des réseaux de neurones profonds et des modèles de langage, il vient gonfler les rangs de l’une des unités les plus techniques d’Anthropic, celle consacrée au préapprentissage de l’IA. C’est cette équipe qui pilote les immenses phases d’entraînement des modèles d’IA qui alimentent Claude. Dans le cadre de l’entraînement, l’IA est nourrie avec des milliards de pages de texte, d’images et de code pour lui donner ses bases de connaissances et de raisonnement. C’est une phase clé dans la conception d’un modèle linguistique.

Sous la direction de Nick Joseph, responsable de l’apprentissage des modèles d’IA, Karpathy sera d’abord chargé de mettre sur pied une nouvelle équipe. Celle-ci aura pour mission d’explorer comment l’IA peut se servir d’elle‑même pour automatiser et optimiser certaines étapes de sa propre construction. En clair, Anthropic veut confier à l’IA la création de l’IA. C’est l’un des grands axes de recherche visant à accélérer la génération de grands modèles. Si l’équipe de pré‑apprentissage parvient à mieux optimiser les phases d’entraînement, cela peut se traduire concrètement par des modèles plus rapides, plus précis et moins sujets aux hallucinations

À lire aussi : OpenAI lance Daybreak, l’IA qui détecte et corrige les failles de sécurité en quelques minutes

OpenAI vs Anthropic

Le recrutement de Karpathy s’inscrit dans la stratégie de recrutement à grande échelle d’Anthropic. Bien décidée à faire de l’ombre à OpenAI, la société américaine intensifie ses efforts pour attirer les meilleurs chercheurs, y compris en piochant dans les effectifs de son concurrent. Il y a deux ans, Anthropic a d’ailleurs recruté John Schulman, cofondateur d’OpenAI et figure clé de ChatGPT.  Le chercheur a quitté définitivement le laboratoire de Sam Altman pour rejoindre Anthropic, justifiant son départ par son désir de se concentrer davantage sur l’alignement de l’IA. L’informaticien voulait aussi revenir à un travail technique et pratique, et délaisser la gestion et la stratégie d’entreprise. John Schulman a finalement déserté Anthropic quelques mois plus tard, pour rejoindre Thinking Machines Lab, dont il est désormais le directeur scientifique.

En parallèle, OpenAI a opéré un virage stratégique d’ampleur pour rattraper le retard pris sur son rival, particulièrement sur le marché de la productivité et de l’entreprise. OpenAI a ainsi choisi de sabrer dans plusieurs projets jugés trop coûteux pour leurs retombées, à l’image de son réseau social Sora. La start-up veut tout faire pour que ChatGPT fasse de l’ombre à Claude. Depuis quelques semaines, ChatGPT enregistre par ailleurs une vague de désinstallations. De nombreux utilisateurs désertent pour se tourner vers Claude, une alternative perçue comme plus éthique depuis le scandale du partenariat d’OpenAI avec l’armée américaine.

👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.


Florian Bayard