Intelligence Artificielle|il y a environ 3 heures|4 sources

Nvidia prépare une puce d'inférence IA secrète pour un lancement à GTC le mois prochain

Nvidia développe une puce d'inférence IA pour OpenAI, à dévoiler à la GTC de San Jose le mois prochain. Elle intègre la technologie Groq au milieu d'une compétition intense.

Nvidia aurait développé en secret un processeur dédié à l’inférence en intelligence artificielle (IA), destiné principalement à OpenAI et d’autres entreprises pour accélérer l’exécution de leurs modèles. Cette puce serait dévoilée lors de la conférence annuelle des développeurs GTC, prévue à San Jose le mois prochain. Elle intégrerait une technologie issue de la startup Groq. L’inférence désigne le processus d’exécution en production des modèles IA préalablement entraînés, par opposition à l’entraînement qui requiert une puissance de calcul massive. Nvidia domine actuellement le marché des unités de traitement graphique (GPU) pour l’entraînement IA, mais la concurrence s’intensifie dans l’inférence. Google et Amazon Web Services ont lancé des puces spécialisées rivales des GPU de Nvidia, tandis que des startups comme Cerebras Systems et SambaNova Systems défient également le géant. OpenAI, insatisfait de la vitesse des GPU Nvidia pour certains usages tels que le développement logiciel, testerait cette puce en avance et en serait un adopteur précoce. Nvidia aurait noué un partenariat stratégique avec Groq, sous la forme d’une acquisition en décembre ou d’un accord de licence de 20 milliards de dollars, ce qui aurait stoppé les discussions entre OpenAI et la startup. Cette dernière envisageait des alternatives pour couvrir 10 % de ses besoins en inférence. Par ailleurs, Nvidia aurait investi 30 milliards de dollars dans OpenAI la semaine dernière, renforçant leurs liens malgré les efforts de diversification de l’entreprise. La conférence GTC constitue un événement majeur pour les annonces matérielles de Nvidia. Ce lancement potentiel pourrait confirmer la stratégie du groupe face à une concurrence accrue en inférence, alors que la demande explose pour des réponses IA plus rapides. Il marquerait une bascule vers ce domaine clé, où Nvidia cherche à conserver sa position dominante dans un paysage computing en pleine mutation.

4 sources

Article enrichi par l'IA

Cet article a été enrichi avec du contexte additionnel provenant des connaissances de l'IA (historique, comparaisons, données techniques). Les sources éditoriales restent la base factuelle.

Report: Nvidia is working on a top secret AI inference chip that could debut next month

Source éditoriale·SiliconANGLE·2 mars 2026

Exclusive | Nvidia Plans New Chip to Speed AI Processing, Shake Up Computing Market

Recherche web·Wall Street Journal

Nvidia plans new chip to speed AI processing: WSJ

Recherche web·The Economic Times

Contexte ajouté : Explication de l'inférence IA vs entraînement, rôle historique de GTC pour annonces Nvidia, position dominante Nvidia en GPU AI et bascule vers inférence

Contexte IA

Restez informé avec Morni

Créez un compte gratuit pour accéder aux articles complets, aux flux personnalisés et aux résumés générés par IA.