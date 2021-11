Nvidia sta aggiungendo un nuovo switch master nel segmento HPC, che si dice vanti prestazioni tre volte superiori al suo predecessore fornendo 64 porte a 400 Gbit/so 128 porte a 200 Gbit/s. Il nucleo del trasformatore Quantum-2 InfiniBand è un chip con 57 miliardi di transistor.

Quantum-2 è destinato a subentrare all’eredità della precedente ammiraglia QM8700 alias “Quantum-1”, che è elencata come prodotto separato sul sito Web di Nvidia, nella scheda tecnica (PDF), ma è chiaramente riconoscibile come un precedente prodotto Mellanox.

Throughput bidirezionale di 50,2 TB/s

Con Quantum-2, Nvidia pubblicizza prestazioni tre volte superiori rispetto al suo predecessore, che possono essere derivate dal numero di porte e dalla sua velocità bidirezionale. Mentre Quantum-1 consente ancora un throughput massimo di 16 Gbit/s, risultato di 80 porte a una velocità massima di 100 Gbit/s o 40 porte a 200 Gbit/s, Quantum-2 ora offre 64 porte a 400 Gbit/s so 128 porte a 200 Gbit/s, con una velocità di trasferimento bidirezionale di 50,2 Tb/s.

Sistemi di commutazione con un massimo di 2048 porte

Con il doppio del throughput dei dati e il triplo del numero di porte, poiché Nvidia scarta l’opzione a 80 porte del Quantum-1, il numero di switch nel data center può essere ridotto di un fattore 6. Lo spazio richiesto e il consumo energetico possono anche essere ridotto del 7% per interruttore. Quantum-2 può essere utilizzato per configurare sistemi di switch che possono avere un totale di fino a 2048 porte.

Switch più grande di Nvidia A100

A parte le porte, il chip “Quantum-2” è lo switch effettivo all’interno dello switch Quantum-2 InfiniBand, che ha di nuovo un formato 1U. Nvidia rivela solo pochissimi dettagli e soprattutto i nomi dei 57 miliardi di transistor che sono stati prodotti da TSMC nell’N7. Per quanto riguarda lo switch, questo è un gigante se si confronta l’attuale acceleratore AI più veloce di Nvidia A100, che ha 54,2 miliardi di transistor ed è prodotto con lo stesso processo presso TSMC.

Utilizzare con ConnectX-7 o BlueField-3

Nvidia descrive anche il Quantum-2 come una nuova piattaforma per supercomputer, che offre due opzioni di connessione di rete per endpoint con ConnectX-7-NIC e BlueField-3-DPU. Connetti X-7 (PDF) è l’attuale fiore all’occhiello della NIC di Nvidia con 8 miliardi di transistor a 7 nm, progettati per un massimo di 4 porte e anche fino a 400 Gbit/s. Secondo Nvidia, ConnectX-7 sarà disponibile come campione per la prima volta a gennaio del prossimo anno.

Software BlueField-3 Integriert ConnectX-7

BlueField-3 è una NIC e un’unità di elaborazione dati in un’unica soluzione. Una DPU dovrebbe alleggerire la CPU in un supercomputer e consistere in una scheda di rete con un processore ARM e svolgere attività critiche nelle aree della rete, della gestione della memoria e della sicurezza. La DPU presentata al GTC di aprile è basata su una CPU con 16 ARM Cortex-A78, che dovrebbe fornire la potenza di calcolo di 300 core CPU classici quando le applicazioni vengono accelerate di conseguenza. Per le reti accelerate, RDMA/RoCE, GPU Direct e SDN/NFV vengono elaborati sulla DPU e tecnologie come NVMe-oF (su fabric), storage elastico (ad esempio su Amazon) e compressione sono disponibili per lo storage veloce. BlueField-3 integra una NIC ConnectX-7 con una velocità di 400 Gbit/s e DDR5 con l’interfaccia di memoria associata e contiene 22 miliardi di transistor da 7 nm.

Nvidia BlueField-3 (immagine: Nvidia)

Quantum-2 è ora disponibile da noti fornitori di infrastrutture e sistemi come Atos, DataDirect Networks (DDN), Dell Technologies, Excelero, Giabyte, HPE, IBM, Inspur, Lenovo, Penguin Computing, QCT, Supermicro, VAST Data e WekaIO .

