Vertiv et NVIDIA collaborent pour développer une architecture complète d’alimentation et de refroidissement pour la plateforme GB200 NVL72

Vertiv, une société mondiale spécialisée dans les solutions d’infrastructure critique et de services pour les centres de données, les réseaux de communication et d’autres environnements critiques, annonce le lancement d’une architecture de référence complète de 7 MW de la plateforme NVIDIA GB200 NVL72, développée conjointement avec NVIDIA, qui permettra aux clients de transformer les architectures […]. Lire plus >

Mot clé : IA -- publié le 22/10/2024 09:00:00





BitNet.cpp : le cadre open source de Microsoft pour réduire les coûts d’inférence des LLMs quantifiés à 1 bi

Microsoft a récemment publié BitNet.cpp, un cadre open-source conçu pour optimiser l’inférence des grands modèles de langage (LLM) quantifiés à 1 bit. Il permet notamment d’exécuter un modèle BitNet b1.58 de 100 milliards de paramètres sur un seul processeur, atteignant des vitesses de traitement comparables à la lecture humaine, à une cadence de 5-7 jetons […]. Lire plus >

Mot clé : IA -- publié le 22/10/2024 08:00:00






Je souhaite en savoir plus