Η NVIDIA ανακοίνωσε τα τελευταία Open Models της στην οικογένεια Nemotron 3, τα οποία περιλαμβάνουν τρία μεγέθη και επιτυγχάνουν ταχύτερη απόδοση AI.
Ανακοινώθηκαν τα μοντέλα NVIDIA Nemotron 3 Open AI σε μεγέθη Nano “30B”, Super “100B”, Ultra “500B”
Δελτίο Τύπου: Η NVIDIA ανακοίνωσε σήμερα την οικογένεια ανοιχτών μοντέλων, δεδομένων και βιβλιοθηκών NVIDIA Nemotron 3 που έχουν σχεδιαστεί για να τροφοδοτούν διαφανή, αποτελεσματική και εξειδικευμένη ανάπτυξη τεχνητής νοημοσύνης σε όλους τους κλάδους.
Τα μοντέλα Nemotron 3 — με μεγέθη Nano, Super και Ultra — εισάγουν μια πρωτοποριακή αρχιτεκτονική υβριδικού λανθάνοντος μείγματος ειδικών (MoE) που βοηθά τους προγραμματιστές να δημιουργήσουν και να αναπτύξουν αξιόπιστα συστήματα πολλαπλών παραγόντων σε κλίμακα.
Η NVIDIA Nemotron υποστηρίζει τις ευρύτερες κυρίαρχες προσπάθειες τεχνητής νοημοσύνης της NVIDIA, με οργανισμούς από την Ευρώπη έως τη Νότια Κορέα να υιοθετούν ανοιχτά, διαφανή και αποτελεσματικά μοντέλα που τους επιτρέπουν να κατασκευάζουν συστήματα AI ευθυγραμμισμένα με τα δικά τους δεδομένα, κανονισμούς και αξίες.
Οι πρώιμοι χρήστες, συμπεριλαμβανομένων των Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens και Zoom, ενσωματώνουν μοντέλα από την οικογένεια Nemotron για να ενισχύσουν τις ροές εργασίας AI σε κλάδους παραγωγής, λογισμικού, ανάπτυξης, επικοινωνίας και ασφάλειας στον κυβερνοχώρο.
Τα ανοιχτά μοντέλα Nemotron 3 επιτρέπουν στις νεοσύστατες επιχειρήσεις να αναπτύσσουν και να επαναλαμβάνουν ταχύτερα τους πράκτορες τεχνητής νοημοσύνης και να επιταχύνουν την καινοτομία από το πρωτότυπο στην ανάπτυξη της επιχείρησης. Οι εταιρείες χαρτοφυλακίου από το Mayfield εξερευνούν το Nemotron 3 για να δημιουργήσουν συμπαίκτες AI που υποστηρίζουν τη συνεργασία ανθρώπου-AI.

Το Nemotron 3 επανεφευρίσκει την τεχνητή νοημοσύνη πολλαπλών παραγόντων με αποτελεσματικότητα και ακρίβεια
Η οικογένεια μοντέλων MoE Nemotron 3 περιλαμβάνει τρία μεγέθη:
- Nemotron 3 Nanoένα μικρό μοντέλο 30 δισεκατομμυρίων παραμέτρων με 3 δισεκατομμύρια ενεργά, για στοχευμένες, εξαιρετικά αποδοτικές εργασίες.
- Nemotron 3 Superένα μοντέλο συλλογισμού υψηλής ακρίβειας με περίπου 100 δισεκατομμύρια παραμέτρους και 10 δισεκατομμύρια ενεργές, για εφαρμογές πολλαπλών παραγόντων.
- Nemotron 3 Ultraμια μεγάλη συλλογιστική μηχανή με περίπου 500 δισεκατομμύρια παραμέτρους και 50 δισεκατομμύρια ενεργές, για πολύπλοκες εφαρμογές τεχνητής νοημοσύνης.
Διαθέσιμο σήμερα, το Nemotron 3 Nano είναι το πιο αποδοτικό από άποψη υπολογιστικού μοντέλου, βελτιστοποιημένο για στοχευμένες εργασίες όπως ο εντοπισμός σφαλμάτων λογισμικού, η σύνοψη περιεχομένου, οι βοηθοί τεχνητής νοημοσύνης και η ανάκτηση πληροφοριών με χαμηλό κόστος συμπερασμάτων. Το μοντέλο χρησιμοποιεί μια μοναδική υβριδική αρχιτεκτονική MoE, προσφέροντας κέρδη στην αποτελεσματικότητα και την επεκτασιμότητα.
Αυτός ο σχεδιασμός επιτυγχάνει έως και 4 φορές υψηλότερη απόδοση διακριτικού σε σύγκριση με το Nemotron 2 Nano και μειώνει τη δημιουργία λογιστικών διακριτικών έως και 60%, μειώνοντας σημαντικά το κόστος συμπερασμάτων. Με ένα παράθυρο περιβάλλοντος 1 εκατομμυρίου διακριτικών, το Nemotron 3 Nano θυμάται περισσότερα, καθιστώντας το πιο ακριβές και πιο ικανό να συνδέει πληροφορίες σε μεγάλες εργασίες πολλαπλών βημάτων.

Η Artificial Analysis, ένας ανεξάρτητος οργανισμός που αξιολογεί την τεχνητή νοημοσύνη, κατέταξε το μοντέλο ως το πιο ανοιχτό και αποτελεσματικό μεταξύ μοντέλων του ίδιου μεγέθους, με κορυφαία ακρίβεια.
Το Nemotron 3 Super υπερέχει σε εφαρμογές που απαιτούν πολλούς συνεργαζόμενους πράκτορες για την επίτευξη σύνθετων εργασιών με χαμηλό λανθάνοντα χρόνο. Το Nemotron 3 Ultra χρησιμεύει ως προηγμένη μηχανή συλλογιστικής για ροές εργασίας AI που απαιτούν βαθιά έρευνα και στρατηγικό σχεδιασμό.
Το Nemotron 3 Super και το Ultra χρησιμοποιούν την εξαιρετικά αποδοτική μορφή εκπαίδευσης 4-bit NVFP4 της NVIDIA στην αρχιτεκτονική NVIDIA Blackwell, μειώνοντας σημαντικά τις απαιτήσεις μνήμης και επιταχύνοντας την προπόνηση. Αυτή η αποτελεσματικότητα επιτρέπει σε μεγαλύτερα μοντέλα να εκπαιδεύονται στην υπάρχουσα υποδομή χωρίς να διακυβεύεται η ακρίβεια σε σχέση με μορφές υψηλότερης ακρίβειας.
Με την οικογένεια μοντέλων Nemotron 3, οι προγραμματιστές μπορούν να επιλέξουν το ανοιχτό μοντέλο που έχει το σωστό μέγεθος για τους συγκεκριμένους φόρτους εργασίας τους, κλιμακώνοντας από δεκάδες σε εκατοντάδες πράκτορες, ενώ επωφελούνται από ταχύτερη και ακριβέστερη συλλογιστική μακροπρόθεσμου ορίζοντα για πολύπλοκες ροές εργασίας.
Ξεκινήστε με τα ανοιχτά μοντέλα NVIDIA
Το Nemotron 3 Nano είναι διαθέσιμο σήμερα στο Hugging Face και μέσω παρόχων υπηρεσιών συμπερασμάτων, συμπεριλαμβανομένων των Baseten, Deepinfra, Fireworks, FriendliAI, OpenRouter και Together AI.

Το Nemotron προσφέρεται σε εταιρικές πλατφόρμες τεχνητής νοημοσύνης και υποδομής δεδομένων, συμπεριλαμβανομένων των Couchbase, DataRobot, H2O.ai, JFrog, Lambda και UiPath. Για πελάτες σε δημόσια σύννεφα, το Nemotron 3 Nano θα είναι διαθέσιμο στο AWS μέσω του Amazon Bedrock (χωρίς διακομιστή) καθώς και στο Google Cloud, το Coreweave, το Nebius, το Nscale και το Yotta σύντομα.
Το Nemotron 3 Nano είναι διαθέσιμο ως μικρουπηρεσία NVIDIA NIMTM για ασφαλή, επεκτάσιμη ανάπτυξη οπουδήποτε στην υποδομή επιτάχυνσης της NVIDIA για μέγιστο απόρρητο και έλεγχο. Τα NVIDIA Nemotron 3 Super και Ultra αναμένεται να είναι διαθέσιμα το πρώτο εξάμηνο του 2026.
Ακολουθώ Wccftech στο Google για να λαμβάνετε περισσότερες από τις ειδήσεις μας στις ροές δεδομένων σας.
VIA: wccftech.com












