











Et si tous les logiciels étaient condamnés à fonctionner au ralenti ? Les fondeurs peinent en effet à suivre l'emblématique loi de Moore qui dit que les performances des processeurs doivent doubler tous les deux ans. Jon Stokes, consultant spécialisé en semi-conducteurs et cofondateur du site éditorial Arstechnica, affiche son scepticisme : “ Si la loi de Moore a été aussi bien suivie jusqu'en 2005, il est probable que ce ne soit qu'un pur hasard. ” Les fondeurs auraient présumé de leurs capacités à progresser selon un rythme constant. Gordon Moore, fondateur d'Intel, avait rédigé sa loi d'après deux observations : le rythme des progrès en optique devait permettre de graver des transistors deux fois plus petits tous les deux ans, et le nombre de transistors dans une puce conditionnait sa puissance.
Seulement voilà, l'augmentation des performances dépend moins du nombre de transistors que de leur fréquence de fonctionnement. Et celle-ci n'a qu'un rapport indirect avec la loi de Moore. Jusqu'au Pentium 4, il suffisait de miniaturiser un circuit pour que, à voltage égal, sa fréquence augmente. Mais arrivé à une échelle de 90 nm pour la taille d'un transistor, les grains des matériaux utilisés deviennent perméables au courant électrique et s'échauffent jusqu'à enrayer la bonne circulation des données. Au bout d'un certain temps, le processeur risque de “ disjoncter ”. C'est pourquoi Intel, en abaissant la tension électrique, limite la vitesse de ses processeurs aux environs de 3 GHz. Bien loin des objectifs annoncés. “ En 2003, le fondeur annonçait que ses processeurs fonctionneraient cinq ans plus tard à la fréquence de 10 GHz. Ils n'ont jamais atteint 4 GHz, rappelle Jean-Marc Ferré, responsable du développement des nouvelles infrastructures chez IBM. Il faut s'inquiéter d'en être arrivé là à cause d'un problème rencontré dans les usines de semi-conducteurs. ”
Si les fondeurs ne résolvent pas le problème, les processeurs consommeront de moins en moins de courant à chaque génération, mais la fréquence n'augmentera plus. L'issue semble résider dans la mise au point de nouveaux isolants qui empêchent deux connexions proches d'interférer et donc de créer un effet calorifique. En la matière, IBM se targue de disposer d'une longueur d'avance sur Intel. Sa technologie SOI (Silicon on Insulator) consiste à disposer un plancher de verre sous les transistors. Les résultats sont probants : le dernier processeur Power6 est cadencé à la fréquence record de 4,7 GHz. Selon une annonce officielle, l'apport d'un isolant supplémentaire dans les transistors eux-mêmes, l'hafnium, devrait permettre aux puces Cell d'IBM d'atteindre 6 GHz lorsqu'elles seront gravées en 45 nm, à la fin de cette année. Ensuite, il s'agira d'inventer d'autres matériaux. IBM évoque pour 2011 un composé de carbones qui s'autoassemblerait à la surface du silicium en formant des bulles de vide autour des liaisons électriques. La fréquence grimperait encore de 35 %. Intel, qui a déjà adopté l'hafnium dans ses derniers Core 2 en 45 nm, ne fait aucun commentaire sur l'évolution des fréquences. “ Nos développements futurs seront essentiellement basés sur la croissance du nombre de transistors, comme le veut la logique de la loi de Moore ”, assure Fabien Esdourubail, responsable du marché serveurs chez Intel.
Mais Gordon Moore avait omis un paramètre en rédigeant sa loi, celui de la capacité des ingénieurs à inventer régulièrement des circuits toujours plus complexes, c'est-à-dire pour lesquels il est vraiment utile d'augmenter le nombre de transistors. IBM, Intel et AMD n'y sont pas parvenus. Depuis 2004, ils se “ contentent ” de dédoubler les processeurs. Or cette architecture à cœurs multiples n'accélère pas les logiciels. L'incapacité des développeurs à trouver un moyen de l'exploiter correctement a conduit l'arrivée de la virtualisation, laquelle simule une machine sur chacun des cœurs. “ La virtualisation fait économiser de l'espace dans les centres de données parce qu'elle condense plusieurs serveurs en un seul, mais elle ne leur apporte individuellement pas plus de performances, note Benoît Duffau, responsable des infrastructures chez Uperto, l'entité open source de la SSII Devoteam. De plus, elle ne se justifie pas sur les postes de travail. ”
Dès lors, toutes les propositions destinées à contourner la loi de Moore deviennent recevables. Même si l'accélération des ordinateurs emprunte d'autres chemins, à commencer par l'environnement du processeur. Telle est l'idée de Direct Connect Architecture, un système inventé par AMD en 2003 qui consiste à placer dans une puce Opteron toute l'électronique chargée de la connectique. Avec la promesse, pas encore réalisée, de relier directement entre eux des processeurs situés sur des serveurs séparés. Non seulement ceux-ci dialogueraient 100 fois plus rapidement que via un réseau Ethernet mais, surtout, ils s'assembleraient pour ne former qu'une machine à plusieurs processeurs. Intel, lui, implémentera dans ses Xeon, à la fin de l'année, une technologie Quickpath Interconnect (QPI) similaire, mais incompatible avec celle d'AMD. Au second semestre 2009, le fondeur devrait annoncer un partenariat avec SGI pour développer un réseau QPI sur la base de Numalink, le système qui interconnecte les nœuds des supercalculateurs Altix. Intel prévoit une bande passante de 96 Go/s dans deux ou trois ans et AMD de 80 Go/s dans un an. Autre idée envisagée : varier la nature des cœurs au sein du processeur, en intégrant par exemple un circuit d'accélération graphique. “ Il s'agira d'abord de rendre les architectures multicœurs plus intéressantes pour le poste de travail, indique Bernard Seite, directeur technique d'AMD. Mais pas seulement. Un GPU comme celui d'ATI peut exécuter plus rapidement qu'un cœur x86 des traitements particuliers, comme le chiffrement d'informations ou certaines fonctions financières. ” Sur ce modèle, Intel proposera un processeur Larrabee début 2009 et AMD une puce Fusion six mois plus tard. Intel planche déjà sur la suite avec un projet Terascale où tous les cœurs seront posés au-dessus de la mémoire cache, afin de réduire les délais d'interconnexion. Dans le même but, Sun sortira fin 2009 une puce Rock où les cœurs se superposeront en quinconce. Dernier axe de recherche sur le design, Sun estime qu'il est possible de gagner en performances en modifiant le fonctionnement de ses circuits. Rock bénéficiera ainsi de la technique Scout Threading, dans laquelle un processus en attente d'informations se dédouble pour être immédiatement traité avec des données factices. Lorsque les informations attendues arriveront de la mémoire, il n'y aura plus qu'à les insérer dans le résultat du calcul déjà effectué. Ainsi, le processeur passera sans plus attendre au traitement d'un autre processus.
“ Pour que tous ces projets aboutissent, encore faut-il parvenir à ajouter toujours plus de transistors sur le carré de silicium qui sert de socle au circuit ”, prévient le docteur Eng Lim Goh, directeur de la recherche chez SGI. Selon lui, la miniaturisation de la gravure pose elle-même de plus en plus de problèmes : “ Les découvertes actuelles devraient permettre de tenir jusqu'en 2013, au terme d'une génération de circuits dont la résolution aura atteint 22 nm par transistor. Ensuite, c'est l'inconnu à l'échelle scientifique. ” Il souligne notamment un problème dans le rayon ultraviolet qui grave les composants : “ On bricole depuis plusieurs années pour focaliser avec des loupes et de l'eau pure sa longueur d'onde trop importante ; elle mesure 193 nm. Nous arrivons au bout de ce système. L'ultraviolet extrême, avec sa longueur d'onde de 13 nm, est candidat à la relève. Il a juste un défaut rédhibitoire, celui de traverser la matière sans la modifier. ”
Jon Stokes donne la mesure de l'enjeu pour l'industrie des processeurs : “ Tout fondeur doit désormais réinventer sa manière de produire du silicium à chaque nouvelle génération. Cela se traduit par des usines qui coûteront six milliards de dollars l'unité en 2009, soit deux fois plus que le prix actuel. Se pose alors le problème de parvenir à rentabiliser un pareil investissement. ” De part et d'autre, les paris sont risqués. Intel, par exemple, compte décliner son offre. Il ambitionne de fabriquer des processeurs pour les téléphones mobiles, un marché quatre fois plus important que celui des ordinateurs. Pour produire suffisamment, il lui suffit de fabriquer plus de puces avec moins de cœurs, ce qui revient au même en termes de quantité de silicium. Tous les autres fondeurs se réunissent en deux alliances. Leur but consiste à partager leur savoir-faire, voire leurs moyens de production. “ Les processeurs sont gravés par lots sur des disques de silicium de 30 cm de diamètre. Il est prévu de passer à des disques de 45 cm de diamètre, ce qui doublera la production et permettra donc à plusieurs fondeurs d'utiliser la même usine ”, estime Eng Lim Goh. Common Platform est le nom de l'alliance menée par IBM et dans laquelle on retrouve AMD, Infineon, STMicroelectronics, Samsung ou encore Toshiba. En face, l'Asiatique TSMC prendra à sa charge la production de TI, ATI, Broadcom, Marvell, NVidia et VIA. De son côté, Sony abandonne la fabrication de composants et Nec déclare qu'il ne produira pas de puces en 32 nm. “ Chaque usine devra générer un chiffre d'affaires de plus de 13 milliards de dollars par an. Si cela se fait grâce à des processeurs qui consomment moins d'énergie, alors la loi de Moore n'a tout simplement plus d'intérêt ”, conclut Eng Lim Goh.
Après avoir eu plusieurs cœurs identiques, les processeurs associeront bientôt des cœurs de différentes natures. Mettre plusieurs circuits dans une seule puce réduit les coûts. Les candidats les plus probables sont les coprocesseurs graphiques, lesquels exécutent aussi des fonctions financières ou scientifiques spécialisées.
La recherche de puissance dans un ordinateur passe par l'élimination des goulets d'étranglement autour du processeur. En confiant à ce dernier les fonctions de contrôle du réseau ou de la mémoire, on multiplie par 100 la vitesse de communication entre les unités de traitements (autres processeurs voire autres serveurs).
La fréquence devenant critique pour le bon fonctionnement des processeurs, il est décidé de la limiter. Par conséquent, ces derniers consomment moins d'énergie à chaque génération. Les conséquences sont plus d'autonomie pour les portables et moins de dissipation de chaleur pour les serveurs.
(Fabien Esdourubail, responsable du marché serveurs)
“ La multiplication des cœurs est à la fois une réponse industrielle et commerciale au respect de la loi de Moore. Dans les usines, elle fait progresser notre production par paliers. Ainsi, lorsque nous passons à une nouvelle finesse de gravure, nous remédions à un taux très élevé de défauts, de l'ordre de 80 %, en fabriquant deux fois plus de puces de génération précédente. Quand ce taux s'améliore, nous collons ensemble deux puces pour proposer des processeurs avec le double de cœurs. Puis, lorsque le taux est optimal, nous passons à la nouvelle génération de circuits avec deux fois plus de cœurs. Par ailleurs, avoir plusieurs cœurs nous apportera au fil du temps une grande modularité dans le choix de nos designs. ”
(Jean-Marc Ferré, responsable des nouvelles infrastructures)
“ La loi de Moore nous impose des défis scientifiques et nous avons à cœur de les relever. Notre objectif est de parvenir à augmenter la fréquence de fonctionnement de nos processeurs sans toucher à la consommation électrique. Les 4,7 GHz ont été atteints sur le Power6 grâce au cumul de dix innovations qui dépassent le cadre strict des semi-conducteurs. Notre savoir-faire porte sur l'atome et sur les nanotechnologies. Nos succès légitiment que l'organisation des alliances pour partager nos ressources avec la plupart des fondeurs. D'autant que parvenir à augmenter la fréquence de 35 % tous les deux ans permet aussi de proposer très facilement des puces d'une consommation électrique inférieure au modèle précédent. ”
(Bernard Seite, directeur technique)
“ Le fonctionnement de l'informatique a évolué depuis l'invention de la loi de Moore. Aujourd'hui, par exemple, des moteurs de recherche tels que Google ne peuvent se permettre de stocker les données les plus consultées sur disque. Nous avons la certitude depuis 2003 que la puissance du processeur doit désormais croître dans son environnement. Grâce à Hypertransport et à la gestion interne de la mémoire, notre Opteron dispose d'une bande passante vers l'extérieur plus de quatre fois supérieure à celle de nos concurrents. Dans un an, nous multiplierons encore ce débit par trois. Cela ouvre des perspectives inédites, comme cumuler la puissance et la mémoire de plusieurs machines, acquises au fur et à mesure selon les besoins, au service d'une seule application. ”
(Jean-Yves Migeon, responsable de l'offre serveurs)
“ L'enjeu pour les serveurs n'est plus une question de puissance, mais d'économie. Nous avons pris le parti dans l'Ultrasparc T2 de pousser cette logique à l'extrême, c'est-à-dire d'inclure dans une même puce ce qu'on retrouve dans plusieurs serveurs, ceci afin de réduire d'autant le coût du matériel et les risques de pannes. Notre processeur intègre huit cœurs individuellement capables d'exécuter huit processus, ce qui revient à 64 serveurs virtuels. S'y trouvent également huit coprocesseurs arithmétiques, des circuits de chiffrement, deux contrôleurs Ethernet 10 GE et toute la gestion des bus d'extension. Par ailleurs, ce processeur tourne à 1,4 GHz. Pourquoi aller au-delà puisque cette vitesse suffit amplement ? ”
Ce matériau est utilisé pour isoler les contacts sur un transistor de 45 nm ou moins. Il n'apporte aucune amélioration de performance, mais le classique dioxyde de silicium n'est plus efficace à cette échelle. Intel est pour l'instant le seul à l'avoir déployé.
Il s'agit de former la mémoire cache du processeur avec un circuit DRAM conventionnel plutôt que selon une architecture SRAM, plus complexe. A niveau de gravure égale, le processeur dispose d'une mémoire cache trois fois plus importante.
Les différents circuits gravés sont superposés dans la puce plutôt que disposés côte à côte. Il s'agit notamment de placer la mémoire cache sous les cœurs des processeurs. Cette approche réduit la longueur des connexions d'un facteur 1000 et multiplie par 100 la largeur du bus entre les processeurs et leur cache. A fréquence égale, un processeur consomme 20 % d'énergie en moins.
Les rayons ultraviolets utilisés pour graver des processeurs ont une longueur d'onde de 193 nm. Pour atteindre une finesse de gravure de 32 nm, il est prévu de doubler les lentilles d'un bain d'eau pur qui fait loupe et de graver les circuits en deux fois.
Avant la gravure du circuit, un composé de carbones est répandu sur la surface de silicium. Par action chimique, s'y forme une couche uniformément perforée par des trous de 20 nm. Ces trous agissent comme un isolant : ils empêchent deux connexions proches d'interférer et donc de chauffer. Une puce ainsi gravée ira 35 % plus vite à voltage égal, ou consommera 15 % d'énergie en moins à fréquence égale.
