Jensen, PDG de Nvidia Huang a déclaré que la plate-forme de superpuces IA de nouvelle génération de l’entreprise, Vera Rubin, commencerait à atteindre les clients plus tard cette année. “Aujourd’hui, je peux vous dire que Vera Rubin est en pleine production”, a déclaré Huang lundi lors d’un événement de presse au salon annuel de la technologie CES à Las Vegas.
Rubin réduira le coût de fonctionnement des modèles d’IA à environ un dixième de celui du principal système de puces actuel de Nvidia, Blackwell, a déclaré la société aux analystes et aux journalistes lors d’un appel téléphonique dimanche. Nvidia affirme également que Rubin peut entraîner certains des plus grands modèles en utilisant environ un quart des puces dont Blackwell a besoin. Pris ensemble, ces gains pourraient rendre les systèmes d’IA avancés beaucoup moins chers à exploiter et rendre plus difficile pour les clients de Nvidia de justifier l’abandon de son matériel.
Nvidia a déclaré lors de l’appel que deux de ses partenaires existants, Microsoft et CoreWave, seraient parmi les premières entreprises à commencer à proposer des services alimentés par la puce Rubin plus tard cette année. Les deux grands centres de données d’IA que Microsoft construit actuellement en Géorgie et dans le Wisconsin comprendront des milliers de puces Ruby, a ajouté Nvidia. Certains partenaires de Nvidia ont commencé à exécuter leurs modèles d’IA de nouvelle génération sur les premiers systèmes Ruby, a indiqué la société.
Le géant des semi-conducteurs a également déclaré qu’il travaillait avec Red Hat, qui fabrique des logiciels d’entreprise open source pour les banques, les constructeurs automobiles, les compagnies aériennes et les agences gouvernementales, pour proposer davantage de produits qui fonctionneront sur le nouveau système de puce Rubin.
La dernière plate-forme de puces de Nvidia porte le nom de Vera Rubin, une astronome américaine qui a remodelé la façon dont les scientifiques comprennent les propriétés des galaxies. Le système comprend six puces différentes, dont un GPU Rubin et un CPU Vera, tous deux fabriqués à l’aide du processus de fabrication de 3 nanomètres de Taiwan Semiconductor Manufacturing Company et de la technologie de mémoire à bande passante la plus avancée disponible. La technologie d’interconnexion et de commutation de sixième génération de Nvidia relie les différentes puces entre elles.
Chaque élément de ce système de puces est « absolument révolutionnaire et le meilleur de son genre », a annoncé Huang lors de la conférence de presse de l’entreprise au CES.
Nvidia développe le système Rubin depuis des années et Huang a annoncé pour la première fois que les puces arriveraient en 2024 lors d’un discours d’ouverture. L’année dernière, la société a annoncé que les systèmes construits sur Rubin commenceraient à arriver au second semestre 2026.
On ne sait pas exactement ce que Nvidia entend par Vera Rubin en disant « en pleine production ». En règle générale, ce développement de puces, que Nvidia développe avec son partenaire de longue date TSMC, commence à faible volume pendant que les puces passent par des tests et des vérifications et s’accélèrent à un stade ultérieur.
“Cette annonce au CES autour de Rubin a pour but de dire aux investisseurs : ‘Nous sommes sur la bonne voie'”, a déclaré Austin Lyons, analyste chez Creative Strategist et auteur du Semiconductor Industry Newsletter. puce strat. Il y avait des rumeurs à Wall Street selon lesquelles le GPU Rubin était en retard, dit Lyons, donc Nvidia recule maintenant, affirmant avoir franchi les étapes clés de développement et de test et est convaincu que Rubin est toujours sur la bonne voie pour démarrer la production dans la seconde moitié de 2026.
En 2024, Nvidia a dû retarder ses nouvelles puces Blackwell en raison d’un défaut de conception qui les faisait surchauffer lorsqu’elles étaient connectées ensemble dans un rack de serveur. Les expéditions reprennent comme prévu pour Blackwell à la mi-2025.
Alors que l’industrie de l’IA se développe rapidement, les éditeurs de logiciels et les fournisseurs de services cloud ont dû se livrer une concurrence féroce pour accéder aux nouveaux GPU de Nvidia. La demande de rubis sera probablement élevée. Mais certaines entreprises couvrent leurs paris en investissant dans leurs propres conceptions de puces personnalisées. Par exemple, OpenAI a déclaré qu’elle travaillait avec Broadcom pour développer du silicium sur mesure pour ses modèles d’IA de nouvelle génération. Ces partenariats mettent en évidence un risque à long terme pour Nvidia : les clients qui conçoivent leurs propres puces peuvent acquérir un niveau de contrôle sur leur matériel que l’entreprise n’offre pas.
Mais Lyons a déclaré que les annonces d’aujourd’hui montrent comment Nvidia va au-delà de la simple offre de GPU pour devenir un “architecte de système d’IA complet, couvrant le calcul, la mise en réseau, la hiérarchie de la mémoire, le stockage et l’orchestration logicielle”. Même si Hyperscale investit dans du silicium personnalisé, a-t-il ajouté, la plate-forme étroitement intégrée de Nvidia « devient de plus en plus difficile à déloger ».






