La HBM, c’est cette mémoire empilée en 3D qu’on trouve aujourd’hui dans les GPU Nvidia et AMD des data centers, là où s’entraînent les gros modèles d’IA. Samsung, qui en produit déjà pour les serveurs, travaille sur une version adaptée aux smartphones et tablettes. Le géant coréen utilise des techniques de packaging avancé pour empiler des couches de mémoire dans un format compact et sobre en énergie. Le gain annoncé : 30 % de bande passante supplémentaire par rapport à la mémoire mobile actuelle.
Pourquoi la mémoire est le vrai goulet d’étranglement de l’IA sur smartphone
Aujourd’hui, les assistants IA embarqués (Gemini Nano et Gemma chez Google, Phi-3 mini chez Microsoft) fonctionnent avec des versions allégées de modèles de langage, taillées pour consommer peu de mémoire. Le résultat est correct pour des tâches simples, mais dès qu’on pousse la complexité, le téléphone renvoie la requête au cloud. La raison est matérielle : la mémoire LPDDR5X qui équipe les smartphones haut de gamme ne débite pas assez vite pour alimenter un vrai réseau de neurones en temps réel.
Ce n’est d’ailleurs pas un sujet nouveau. En février 2025, le directeur technique de la division semiconducteurs de Samsung, Song Jae-hyuk, avait déjà présenté à la conférence ISSCC une technologie baptisée LPW DRAM qu’il qualifiait lui-même de « HBM mobile ». Objectifs : un débit de plus de 200 Go/s (+166 % par rapport au LPDDR5X) et une consommation réduite de moitié. Premier produit commercial annoncé pour 2028. Samsung co-développerait cette brique avec Apple et sa propre division Galaxy.
Samsung n’est pas seul sur le coup, et le prix freinera tout le monde
SK Hynix prépare une approche concurrente baptisée Vertical Fan-Out, elle aussi destinée au mobile. La course est lancée entre les deux géants coréens de la mémoire, avec en embuscade les fabricants de puces mobiles (Qualcomm, MediaTek, Apple) qui devront adapter leurs processeurs pour en tirer parti.
Reste un obstacle que la technologie seule ne lèvera pas : le prix. La DRAM mobile a atteint des niveaux historiquement élevés en 2025-2026, portée justement par la demande IA côté serveurs. Tant que cette tension persiste, les fabricants de smartphones hésiteront à intégrer une mémoire plus coûteuse dans des appareils grand public.
Pour les utilisateurs européens, les conséquences sont vertueuses. L’IA embarquée traite les données localement, sans les transferts vers un cloud américain ou asiatique auxquels nous ont habitués Google, OpenAI et Anthropic. Le RGPD et l’AI Act encouragent précisément ce traitement local des données personnelles. Un smartphone capable de faire tourner un assistant IA complet sans connexion cloud réduirait la dépendance aux serveurs étrangers et la surface d’exposition aux transferts hors UE.
👉🏻 Suivez l’actualité tech en temps réel : ajoutez 01net à vos sources sur Google, et abonnez-vous à notre canal WhatsApp.
Source : ETNews

