giovedì, Novembre 21, 2024
HomeAZIENDEAttualitàProblemi di surriscaldamento per le GPU Blackwell di NVIDIA?

Problemi di surriscaldamento per le GPU Blackwell di NVIDIA?

NVIDIA GPU Blackwell
Rack GB200 NVL72 di NVIDIA.

Dopo i problemi di rendimento di un paio di mesi fa, i processori Blackwell del gigante dell’intelligenza artificiale sarebbero soggetti a surriscaldamento quando installati in rack per server ad alta capacità.

Secondo un rapporto di The Information, le GPU Blackwell per l’intelligenza artificiale e l’elaborazione ad alte prestazioni (HPC) presenterebbero problemi di surriscaldamento nei server che ospitano 72 processori e che possono richiedere fino a 120 kW per rack.

L’eccessivo riscaldamento avrebbe portato a modifiche di progettazione e ritardi, suscitando preoccupazioni da parte di importanti clienti come Google, Meta e Microsoft in merito alla tempestiva distribuzione dei server Blackwell.

Per questo motivo, NVIDIA avrebbe rivisto più volte la progettazione dei suoi rack per server, poiché il surriscaldamento non solo ostacola le prestazioni della GPU, ma rischia anche di danneggiare l’hardware.

Un portavoce di NVIDIA ha dichiarato alla Reuters che l’azienda sta collaborando strettamente con i fornitori di servizi cloud e ha descritto le modifiche alla progettazione come una parte normale del processo di sviluppo. Ciò tuttavia non è servito a tranquillizzare gli hyperscaler che si affidano alle GPU di NVIDIA per addestrare i loro modelli linguistici più avanzati.



La versione finale di Blackwell è entrata in produzione di massa solo a fine ottobre, il che indica che le spedizioni dovrebbero iniziare a fine gennaio. Resta da vedere se l’ultimo problema di surriscaldamento ritarderà ulteriormente la spedizione e in che misura.

Questa non è certamente la prima volta che NVIDIA riscontra problemi su Blackwell. Un paio di mesi fa, era stato segnalato un difetto di progettazione che ha influito sulle rese del processore, e che si dice sia correlato al packaging avanzato CoWoS di TSMC; alla fine il problema è stato risolto apportando modifiche alle maschere delle GPU.

Nonostante questi ritardi – che il CEO di NVIDIA Jensen Huang ha attribuito a TSMC –  la produzione è ripresa “a un ritmo incredibile” con rendimenti elevatissimi. Il buon andamento della produzione delle GPU di NVIDIA è indirettamente confermata dai dati sulla produzione che TSMC diffonde mensilmente.

Questa indiscrezione arriva a pochi giorni dalla diffusione della trimestrale di NVIDIA (prevista per mercoledì prossimo dopo la chiusura dei mercati) e della Conference Call con i dirigenti dell’azienda che consentirà di avere maggiori informazioni sul trend di crescita dell’azienda.

Nel frattempo, molti analisti finanziari hanno rivisto al rialzo le previsioni e il prezzo obiettivo dell’azienda; ad oggi il prezzo obiettivo medio è di 160,38 dollari, con un massimo di 202 e un minimo di 90. Dei 68 analisti che seguono NVIDIA, 49 raccomandano BUY, 10 consigliano ACCUMULATE, 4 indicano HOLD e 5 non si esprimono.