La 58^ classifica TOP500 dei supercomputer più performanti ha visto pochi cambiamenti nei primi dieci posti. Il sistema Microsoft Azure Voyager-EUS2 è stata l’unica macchina a scalare le prime posizioni piazzandosi al decimo posto della classifica. Basato su un processore AMD EPYC con 48 core e 2,45 GHz che lavora insieme a una GPU NVIDIA A100 e 80 GB di memoria, Voyager-EUS2 utilizza anche la tecnologia Mellanox HDR Infiniband per il trasferimento dei dati.
Sebbene non ci siano stati altri cambiamenti nella Top10, Perlmutter ha migliorato le sue prestazioni a 70,9 Pflop/s. Ospitato presso il Lawrence Berkeley National Laboratory, l’aumento delle prestazioni di Perlmutter non ha avuto effetto sulla sua posizione di classifica.
Fugaku continua a mantenere la posizione n. 1 che ha ottenuto per la prima volta nel giugno 2020. Il suo punteggio di riferimento HPL è di 442 Pflop/s, 3 volte superiore a Summit che occupa la seconda posizione in classifica. Installato presso il Riken Center for Computational Science (R-CCS) di Kobe, in Giappone, è stato sviluppato congiuntamente da Riken e Fujitsu ed è basato sul processore ARM A64FX personalizzato di Fujitsu. Fugaku utilizza anche l’interconnessione Tofu D di Fujitsu per trasferire i dati tra i nodi.
Nelle operazioni a precisione singola o ulteriormente ridotta, spesso utilizzata nell’apprendimento automatico e nelle applicazioni di intelligenza artificiale, Fugaku ha prestazioni di picco superiori a 1.000 PFlop/s (1 Exaflop/s). Di conseguenza, Fugaku viene spesso presentato come il primo supercomputer “Exascale”.
Sebbene ci fossero anche segnalazioni su diversi sistemi cinesi che raggiungevano prestazioni di livello Exaflop, nessuno di questi sistemi ha presentato un risultato HPL al TOP500.
Ecco un riepilogo dei sistemi nella Top10:
Fugaku rimane il sistema numero uno. Ha 7.630.848 core che gli hanno permesso di raggiungere un punteggio di riferimento HPL di 442 Pflop/s. Questo lo pone 3 volte davanti al sistema n. 2 nell’elenco.
Summit, un sistema costruito da IBM presso l’Oak Ridge National Laboratory (ORNL) nel Tennessee, USA, rimane il sistema più veloce negli Stati Uniti e al secondo posto in tutto il mondo. Ha una performance di 148,8 Pflop/s sul benchmark HPL, che viene utilizzato per classificare l’elenco TOP500. Summit ha 4.356 nodi, ciascuno dei quali ospita due CPU Power9 con 22 core ciascuna e sei GPU NVIDIA Tesla V100, ciascuna con 80 streaming multiprocessor (SM). I nodi sono collegati tra loro con una rete Mellanox dual-rail EDR InfiniBand.
Sierra, un sistema del Lawrence Livermore National Laboratory, CA, USA, è al n. 3. La sua architettura è molto simile al Summit con 4.320 nodi con due CPU Power9 e quattro GPU NVIDIA Tesla V100. Sierra ha raggiunto i 94,6 Pflop/s.
Sunway TaihuLight è un sistema sviluppato dal National Research Center of Parallel Computer Engineering & Technology (NRCPC) della Cina, è installato presso il National Supercomputing Center di Wuxi, nella provincia cinese di Jiangsu, ed occupa la quarta posizione con 93 Pflop/s.
Perlmutter occupa la posizione numero 5 ed è entrato in classifica lo scorso giugno. Si basa sulla piattaforma HPE Cray “Shasta” e su un sistema eterogeneo con nodi basati su AMD EPYC e 1536 nodi di accelerazione NVIDIA A100. Perlmutter ha migliorato le sue prestazioni a 70,9 Pflop/s
Selene, ora al n. 6, è un SuperPOD NVIDIA DGX A100 installato presso NVIDIA negli Stati Uniti. Il sistema è basato su un processore AMD EPYC con NVIDIA A100 per l’accelerazione e un Mellanox HDR InfiniBand come rete. Ha raggiunto 63,4 Pflop/s.
Tianhe-2A (Via Lattea-2A), un sistema sviluppato dalla National University of Defense Technology (NUDT) cinese e distribuito presso il National Supercomputer Center di Guangzhou, in Cina, occupa ora la posizione n. 7 con 61,4 Pflop/s.
Il sistema JUWELS Booster Module occupa il posto n. 8 in classifica. Costruito da Atos, è installato presso il Forschungszentrum Juelich (FZJ) in Germania. Il sistema utilizza un processore AMD EPYC con NVIDIA A100 per l’accelerazione e un Mellanox HDR InfiniBand come rete simile al Selene System. È il sistema più potente in Europa con 44,1 Pflop/s.
HPC5 è un sistema PowerEdge costruito da Dell e installato presso Eni SpA. Raggiunge una performance di 35,5 Pflop/s grazie all’utilizzo di NVIDIA Tesla V100 come acceleratori e un Mellanox HDR InfiniBand come rete.
Voyager-EUS2, un sistema Microsoft Azure installato presso Microsoft negli Stati Uniti, è l’unico nuovo sistema nella TOP10 con 30,05 Pflop/s. Questa architettura si basa su un processore AMD EPYC con 48 core e 2,45 GHz che lavora insieme a una GPU NVIDIA A100 con 80 GB di memoria e utilizza un Mellanox HDR Infiniband per il trasferimento dei dati.
Altre informazioni sulla TOP500
Se non ci siano stati molti cambiamenti nella Top10, qualche variazione in più si è verificata all’interno della Top15. Il nuovo sistema Voyager-EUS di Microsoft si è piazzato al n. 11, mentre il sistema SSC-21 di Samsung si è classificato al dodicesimo posto; i nuovi sistemi Polaris e CEA-HF si sono piazzati rispettivamente al 13° e 15° posto.
Come nella precedente, anche in questa classifica i processori AMD stanno facendo il vuoto dietro di sé. Frontera, che utilizza un processore Xeon Platinum 8280, è stato superato da Voyager-EUS2 che monta un processore AMD EPYC. Inoltre, tutte le nuove macchine della Top15 descritte in precedenza utilizzano processori AMD.
Per quanto riguarda i paesi di appartenenza, la scena continua ad essere dominata dagli Stati Uniti con 150 sistemi contro i 123 della precedente classifica, e dalla Cina con 173 sistemi, in calo rispetto alla TOP500 di giugno quando le macchine in classifica erano 186.
La nuova edizione dell’elenco non ha mostrato molti cambiamenti per quanto riguarda le interconnessioni di sistema. Ethernet domina ancora con 240 macchine, mentre Infiniband ne contava 180. Le interconnessioni Ominpath erano 40 mentre c’erano 34 interconnessioni personalizzate e solo 6 sistemi con reti proprietarie.
Risultati Green500
Al primo posto di questa speciale classifica troviamo il sistema giapponese MN-3 di Preferred Networks che utilizza chip MN-Core su un acceleratore ottimizzato per l’aritmetica a matrice. Questa macchina è stata in grado di raggiungere un’incredibile efficienza energetica di 39,38 gigaflop/watt rispetto ai 29,7 gigaflop/watt di sei mesi fa, mostrando importanti miglioramenti. MN-3 ha anche rafforzato la sua posizione nella lista generale TOP500, passando dal n. 337 al n. 302.
Il nuovo modulo scalabile SSC-21, un sistema HPE Apollo 6500 installato presso Samsung Electronics in Corea del Sud, ha raggiunto l’impressionante valore di 33,98 gigaflop/watt; nella classifica generale il sistema occupa la posizione 292.
NVIDIA ha installato un nuovo sistema DGX A100 raffreddato a liquido chiamato Tethys. Con una configurazione HPL ottimizzata per la potenza, Tethys ha raggiunto 31,5 gigaflop/watt e ha ottenuto il terzo posto nella Green500 e il posto n. 296 nella TOP500.
Risultati HPCG
L’elenco TOP500 ha incorporato i risultati del benchmark High-Performance Conjugate Gradient (HPCG), che forniscono una metrica alternativa per valutare le prestazioni dei supercomputer.
I risultati HPCG sono simili all’ultimo elenco, con Fugaku al primo posto conn 16.0 HPCG-petaflop e con Summit che ha mantenuto il suo secondo posto con 2.93 HPCG-petaflop. Perlmutter ha ottenuto il terzo posto con 1.91 HPCG-petaflop.
Risultati HPL-AI
Il benchmark HPL-AI cerca di evidenziare la convergenza dei carichi di lavoro HPC e di intelligenza artificiale (AI) basati su machine learning e deep learning, risolvendo un sistema di equazioni lineari utilizzando nuovi algoritmi di precisione mista che sfruttano l’hardware moderno.
Con un risultato HPL-AI di 2 Exaflop, Fugaku si è piazzato al primo posto anche in questa speciale classifica.
La tabella illustra le caratteristiche dei primi 10 supercomputer della classificata TOP500: