Ο συνιδρυτής και διευθύνων σύμβουλος της Nvidia, Jensen Huang, παρουσίασε το Vera Rubin AI Superchip στο GPU Technology Conference στην Ουάσιγκτον, σηματοδοτώντας τη στροφή της εταιρείας στο υλικό AI εν μέσω της έκρηξης της τεχνητής νοημοσύνης, ενισχύοντας την αγοραία αξία της σε σχεδόν 5 τρισεκατομμύρια δολάρια.
Η πλατφόρμα Vera Rubin στοχεύει σε φόρτους εργασίας υψηλής έντασης τεχνητής νοημοσύνης. Ενσωματώνει έναν μόνο επεξεργαστή Vera εξοπλισμένο με 88 προσαρμοσμένους πυρήνες ARM που υποστηρίζουν 176 νήματα. Αυτή η CPU συνδυάζεται με δύο GPU Rubin για να επιτύχει έως και 100 petaFLOPS υπολογιστικής απόδοσης FP4. Ως υπολογιστής rack NVLink 72 τρίτης γενιάς της Nvidia, η Vera Rubin διαδέχεται τα μοντέλα GB200 και GB300. Το σύστημα χρησιμοποιεί υγρή ψύξη και ενσωματώνει έξι τρισεκατομμύρια τρανζίστορ. Περιλαμβάνει επίσης 2 TB μνήμης SOCAMM2 χαμηλής καθυστέρησης για να χειρίζεται αποτελεσματικά απαιτητικές εργασίες επεξεργασίας AI.
Στη βασική του διαμόρφωση, το Vera Rubin παρέχει περίπου 100 φορές υψηλότερη απόδοση υπολογισμού σε σύγκριση με το DGX-1 που βασίζεται σε Volta. Αυτή η προηγούμενη πλατφόρμα, το αρχικό σύστημα βαθιάς εκμάθησης της Nvidia, παρείχε 170 teraflops κορυφαίας απόδοσης FP16. Αυτή η σημαντική αύξηση υπογραμμίζει την εξέλιξη της υπολογιστικής ικανότητας για εφαρμογές τεχνητής νοημοσύνης με τα χρόνια.
Η Nvidia σχεδιάζει να κυκλοφορήσει το Vera Rubin σε διάφορες διαμορφώσεις για να καλύψει διαφορετικές ανάγκες. Η ρύθμιση NVL144 περιλαμβάνει δύο GPU μεγέθους reticle, οι οποίες επιτρέπουν έως και 3,6 exaflops συμπερασμάτων FP4 και 1,2 exaflops απόδοσης εκπαίδευσης FP8. Για βελτιωμένες δυνατότητες, η διαμόρφωση NVL144 CPX φτάνει τα 8 exaflops, που αντιπροσωπεύουν 7,5 φορές την ισχύ των συστημάτων GB300 NVL72 της τρέχουσας γενιάς.
Για την αντιμετώπιση των απαιτήσεων σε κέντρα δεδομένων υπερκλίμακας για την επεξεργασία μεγαλύτερων φόρτων εργασίας με βάση το μοντέλο, η Nvidia παρουσιάζει το σύστημα Rubin Ultra NVL576. Αυτή η παραλλαγή χρησιμοποιεί τέσσερις GPU μεγέθους δικτυωτού μαζί με έως και 365 TB μνήμης υψηλής ταχύτητας. Παρέχει έως και 15 exaflops συμπερασμάτων FP4 και 5 exaflops προπονητικής απόδοσης FP8, η οποία αντιστοιχεί σε 8 φορές αύξηση σε σχέση με το GB300.
Κάθε GPU Rubin αποτελείται από δύο υπολογιστικά chiplet και οκτώ στοίβες μνήμης HBM4, βελτιστοποιώντας τη διεκπεραίωση δεδομένων και τον υπολογισμό. Η πλακέτα GPU διαθέτει πέντε υποδοχές NVLink backplane. Δύο υποδοχές στο επάνω μέρος συνδέουν τις GPU με τον διακόπτη NVLink για διασυνδεσιμότητα υψηλής ταχύτητας. Οι τρεις κάτω υποδοχές διαχειρίζονται την παροχή ισχύος, τη διεπαφή PCIe και τη συνδεσιμότητα CXL για να υποστηρίζουν την ενσωμάτωση σε ευρύτερα συστήματα.
Η Huang αναμένει ότι οι GPU της Rubin θα εισέλθουν σε μαζική παραγωγή κατά το δεύτερο εξάμηνο του 2026. Τα συστήματα NVL144 έχουν προγραμματιστεί να κυκλοφορήσουν αργότερα το 2026 ή στις αρχές του 2027. Εν τω μεταξύ, τα συστήματα NVL576 αναμένεται να είναι διαθέσιμα το δεύτερο εξάμηνο του 2027, ευθυγραμμισμένα με την προωθητική υποδομή AI της Nvidia.
VIA: DataConomy.com







