Η Tencent κυκλοφορεί το Hunyuan 2.0 με παραμέτρους 406B

Η Tencent κυκλοφόρησε το Hunyuan 2.0, ένα μεγάλο μοντέλο γλώσσας με 406 δισεκατομμύρια συνολικές παραμέτρους, στις 5 Δεκεμβρίου. Αυτή η ενημέρωση στοχεύει τις εξελίξεις στα μαθηματικά, την κωδικοποίηση και τη σύνθετη λογική μέσω μιας αρχιτεκτονικής Mixture-of-Experts και εκλεπτυσμένων μεθόδων εκπαίδευσης.

Το μοντέλο διατίθεται σε δύο παραλλαγές: Think and Instruct. Η αρχιτεκτονική του ενεργοποιεί 32 δισεκατομμύρια παραμέτρους σε κάθε συμπέρασμα, επιτρέποντας την αποτελεσματική επεξεργασία. Υποστηρίζει ένα παράθυρο περιβάλλοντος 256.000 διακριτικών, επιτρέποντας το χειρισμό εκτεταμένων εισόδων χωρίς περικοπή.

Θέσεις Tencent HY 2.0 Σκεφτείτε ότι κατατάσσεται μεταξύ των «κορυφαίων εγχώριων βαθμίδων» για πολύπλοκες συλλογιστικές εργασίες. Αυτή η έκδοση ξεπερνά την προκάτοχό της, Hunyuan-T1-20250822, σε πολλούς τομείς αξιολόγησης. Στο σημείο αναφοράς μαθηματικών IMO-AnswerBench, το HY 2.0 Think κατέγραψε βαθμολογία 73,4, αντικατοπτρίζοντας ισχυρές ικανότητες επίλυσης προβλημάτων σε μαθηματικούς τομείς.

Στις αξιολογήσεις μηχανικής λογισμικού, η απόδοση βελτιώθηκε σημαντικά στο σημείο αναφοράς SWE-bench Verified, αυξάνοντας από 6,0 για το προηγούμενο μοντέλο σε 53,0. Αυτή η βελτίωση δείχνει καλύτερη ακρίβεια στη δημιουργία και τον εντοπισμό σφαλμάτων κώδικα για προκλήσεις προγραμματισμού πραγματικού κόσμου.

Το Tencent HY 2.0 κυκλοφορεί επίσημα. Διαθέτουμε μια σημαντική αναβάθμιση απόδοσης στο μοντέλο βάσης μας, το οποίο είναι πλέον διαθέσιμο μέσω του Tencent Cloud API.
Χτισμένο σε μια αρχιτεκτονική Mixture-of-Experts (MoE) (συνολικά 406B, 32B ενεργές παράμετροι) και διαθέτει παράθυρο περιβάλλοντος 256K, HY 2.0… pic.twitter.com/zmb2zLQTEz
— Hunyuan (@TencentHunyuan) 5 Δεκεμβρίου 2025

Η Tencent πιστώνει αυτές τις εξελίξεις σε βελτιώσεις στην ποιότητα των δεδομένων πριν από την εκπαίδευση και σε μια προσέγγιση ενισχυτικής μάθησης σε δύο στάδια. Αυτή η στρατηγική ενσωματώνει το RLVR ή την Ενισχυτική μάθηση με επαληθεύσιμες ανταμοιβές, που χρησιμοποιεί αντικειμενικές μετρήσεις για εκπαίδευση, και το RLHF ή την Ενισχυτική μάθηση από την ανθρώπινη ανατροφοδότηση, που ενσωματώνει ανθρώπινες αξιολογήσεις για να βελτιώσει τα αποτελέσματα.

Το HY 2.0 Think εφαρμόζει στρατηγικές επιβολής πέναλτι για να αποτρέψει την υπερβολική λεκτικότητα στις απαντήσεις, με αποτέλεσμα αυτό που η Tencent αποκαλεί υπολογιστική απόδοση ανά κουπόνι «κορυφαία στον κλάδο». Αυτός ο σχεδιασμός βελτιστοποιεί τη χρήση των πόρων κατά την παραγωγή, μειώνοντας τον χρόνο και το κόστος επεξεργασίας.

Οι λειτουργίες κωδικοποίησης και πράκτορας προχώρησαν επίσης, με τη βαθμολογία Tau2-Bench να σκαρφαλώνει από το 17,1 στο 72,4. Αυτές οι μετρήσεις αξιολογούν την αυτόνομη εκτέλεση εργασιών και τις αλληλεπιδράσεις που σχετίζονται με τον κώδικα.

Η ενσωμάτωση επεκτείνεται στις καταναλωτικές εφαρμογές της Tencent, όπως το Yuanbao και το ima, όπου το μοντέλο ενισχύει τις αλληλεπιδράσεις των χρηστών. Οι προγραμματιστές μπορούν να έχουν πρόσβαση σε αυτό μέσω της πλατφόρμας API της Tencent Cloud για προσαρμοσμένες υλοποιήσεις. Η Tencent σχεδιάζει να δημιουργήσει τεχνολογίες και μοντέλα ανοιχτού κώδικα για κοινοτική χρήση.