Google serait en pourparlers avec Marvell Technology pour développer deux nouvelles puces d’IA : une unité de traitement de la mémoire et une TPU optimisée pour l’inférence. L’entreprise américaine chercherait ainsi à diversifier sa chaîne d’approvisionnement en semi-conducteurs sur mesure. Elle s’appuierait sur Broadcom, MediaTek et désormais Marvell pour la conception, tout en confiant la fabrication à TSMC.
Un partenariat entre Google et Marvell pour la conception de deux puces
Pour l’instant, aucun contrat n’a été signé, mais d’après le média américain The Information, Google est en étroite discussion avec Marvell Technology pour développer deux nouvelles puces destinées à l’exécution de modèles d’IA. La première puce est une unité de traitement de la mémoire optimisée pour assister les TPU existantes de Google. La seconde est une nouvelle génération de TPU dédiée à l’inférence : la phase opérationnelle où le modèle, une fois entraîné, est sollicité pour générer des prédictions ou des réponses en conditions réelles.
Cette dernière puce a donc pour objectif de rendre Gemini plus rapide et moins coûteux. À travers ce partenariat, Google privilégie l’inférence comme principal poste de dépenses de calcul, et espère ainsi concurrencer Nvidia dans ce domaine. À noter que Marvell interviendrait auprès de Google en tant que prestataire de services de conception.
Un troisième fournisseur pour Google
En s’associant avec Marvell Technology, Google ne remplace pas Broadcom, mais ajoute un partenaire de conception à sa chaîne d’approvisionnement qui comprend Broadcom (les puces de haute performance), MediaTek (notamment les versions de la gamme “e”, optimisées pour offrir un meilleur rapport performance-prix) et TSMC (la fabrication). Il est donc question d’une stratégie de diversification pour Google.
Ironwood, la TPU de septième génération de Google, conçue par Broadcom, a été lancée ce mois-ci. Google la présente comme « la première TPU Google conçue pour l’ère de l’inférence ». Les deux puces développées par Marvell Technology viendront donc compléter celles de Broadcom, sans les remplacer. L’objectif est simple : permettre à Google d’ajuster ses ressources selon les types de tâches ou les budgets. Cela répond à la part de plus en plus importante de calcul consacrée à l’inférence, c’est-à-dire le déploiement des modèles, plutôt qu’à leur phase d’apprentissage.
Google a par ailleurs signé un accord avec la société d’intelligence artificielle Anthropic. Cette dernière aura accès à un gigawatt de capacité de calcul IA, grâce aux puces IA de Google appelées « Tensor Processing Units », ou TPU.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.
Source : The Information

