giovedì, Novembre 21, 2024
HomeAZIENDEIntel presenta la nuova CPU per data center Xeon 6 e l'acceleratore...

Intel presenta la nuova CPU per data center Xeon 6 e l’acceleratore AI Gaudi 3

Intel Xeon 6 Gaudi 3Il lancio avviene in un momento particolarmente difficile per l’azienda sia sul piano finanziario che su quello tecnologico mentre si fanno sempre più insistenti le voci di una possibile acquisizione o dell’entrata nell’azienda di nuovi soci di peso.

Intel ha presentato oggi la CPU Xeon 6 e l’acceleratore AI Gaudi 3 nel tentativo di riguadagnare il terreno perso negli ultimi tempi nei confronti nei principali concorrenti, in particolare di AMD e NVIDIA.

Secondo l’azienda i due nuovi chip offrono prestazioni migliorate ed un’elevata efficienza energetica ed offrono prestazioni ottimali per watt nonché un costo totale di proprietà (TCO) inferiore.

“La domanda di AI sta portando a una massiccia trasformazione nel data center e il settore chiede scelta in hardware, software e strumenti per sviluppatori“, ha affermato Justin Hotard, Executive vice president and general manager of the Data Center and Artificial Intelligence Group di Intel. “Con il lancio di Xeon 6 con P-core e acceleratori AI Gaudi 3, Intel sta abilitando un ecosistema aperto che consente ai nostri clienti di implementare tutti i loro carichi di lavoro con maggiori prestazioni, efficienza e sicurezza”.

L’annuncio odierno segue di pochi giorni le rivelazioni del Wall Street Journal secondo cui Qualcomm starebbe valutando un’acquisizione di Intel per rafforzare il proprio business nei processori. Bloomberg, nel frattempo, ha riferito che anche Apollo Global Management sarebbe interessata ad entrare nel business di Intel con un investimento multimiliardario nel produttore di chip a sostegno del piano di ristrutturazione annunciato dala CEO di Intel Pat Gelsinger.



I nuovi prodotti di Intel per data center

Intel Xeon 6 con P-core: progettato per gestire carichi di lavoro ad alta intensità con un’efficienza eccezionale, Xeon 6 offre il doppio delle prestazioni del suo predecessore. Presenta un numero di core maggiore, il doppio della larghezza di banda di memoria e capacità di accelerazione AI integrate in ogni core. Questo processore è progettato per soddisfare le esigenze di prestazioni dell’AI dagli ambienti edge a quelli data center e cloud.

Acceleratore AI Intel Gaudi 3: specificamente ottimizzato per l’intelligenza artificiale generativa su larga scala, Gaudi 3 vanta 64 core di elaborazione Tensor (TPC) e otto motori di moltiplicazione di matrice (MME) per accelerare i calcoli di reti neurali profonde. Include 128 gigabyte (GB) di memoria HBM2e per l’addestramento e l’inferenza e 24 porte Ethernet da 200 Gigabit (Gb) per reti scalabili. Gaudi 3 offre anche una compatibilità perfetta con il framework PyTorch e modelli avanzati di trasformatore e diffusore Hugging Face. Intel ha recentemente annunciato una collaborazione con IBM per distribuire gli acceleratori AI Intel Gaudi 3 come servizio su IBM Cloud. Attraverso questa collaborazione, Intel e IBM mirano ad abbassare il costo totale di proprietà per sfruttare e scalare l’intelligenza artificiale, migliorando al contempo le prestazioni.

Il processore Gaudi 3 è stato progettato appositamente per applicazioni di intelligenza artificiale generativa e competerà direttamente con la linea di chip H100 di Nvidia e MI300X di AMD.

Migliorare i sistemi di intelligenza artificiale con vantaggi TCO

L’implementazione dell’IA su larga scala comporta considerazioni quali opzioni di implementazione flessibili, rapporti prezzo-prestazioni competitivi e tecnologie AI accessibili. Secondo Intel la solida infrastruttura x86 e il vasto ecosistema aperto consentono alla nuova CPU Xeon 6 di supportare le aziende nella creazione di sistemi AI di alto valore con un TCO e prestazioni per watt ottimali. Secondo l’azienda, attualmente il 73% dei server accelerati da GPU utilizza Intel Xeon come CPU host.

Intel collabora con i principali OEM, tra cui Dell Technologies e Supermicro, per sviluppare sistemi co-ingegnerizzati su misura per le esigenze specifiche dei clienti per implementazioni AI efficaci. Dell Technologies sta attualmente co-ingegnerizzando soluzioni basate su RAG (retrieval-augmented generation) sfruttando Gaudi 3 e Xeon 6.

Colmare il divario tra prototipi e produzione con sforzi di co-ingegneria

La transizione di soluzioni di IA generativa (Gen AI) da prototipi a sistemi pronti per la produzione presenta sfide in termini di monitoraggio in tempo reale, gestione degli errori, registrazione, sicurezza e scalabilità. Intel affronta queste sfide attraverso sforzi di co-ingegnerizzazione con OEM e partner per fornire soluzioni RAG pronte per la produzione.

Queste soluzioni, basate sulla piattaforma Open Platform Enterprise AI (OPEA) integrano microservizi basati su OPEA in un sistema RAG scalabile, ottimizzato per i sistemi Xeon e Gaudi AI, progettato per consentire ai clienti di integrare facilmente applicazioni da Kubernetes, Red Hat OpenShift AI e Red Hat Enterprise Linux AI.

Ampliare l’accesso alle applicazioni di intelligenza artificiale aziendale

Il portafoglio Tiber di Intel offre soluzioni aziendali per affrontare sfide quali accesso, costi, complessità, sicurezza, efficienza e scalabilità in ambienti AI, cloud ed edge. Intel Tiber Developer Cloud fornisce ora sistemi di anteprima di Intel Xeon 6 per la valutazione e il test della tecnologia. Inoltre, alcuni clienti selezionati potranno ottenere un accesso anticipato a Intel Gaudi 3 per la convalida delle distribuzioni di modelli AI, con cluster Gaudi 3 che inizieranno a essere implementati nel prossimo trimestre per distribuzioni di produzione su larga scala.

Le nuove offerte di servizi includono SeekrFlow, una piattaforma AI end-to-end di Seekr per lo sviluppo di applicazioni AI affidabili. Gli ultimi aggiornamenti includono la versione più recente del software Intel Gaudi e i notebook Jupyter caricati con PyTorch 2.4 e Intel oneAPI e strumenti AI 2024.2, che includono nuove capacità di accelerazione AI e supporto per processori Xeon 6.