By using this site, you agree to the Privacy Policy and Terms of Use.
Accept
TechReport.grTechReport.grTechReport.gr
Search
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Reading: Η DeepSeek εισάγει υπερ-συνδέσεις με πολλαπλές περιορισμούς για το R2
Share
Sign In
Notification Show More
Font ResizerAa
TechReport.grTechReport.gr
Font ResizerAa
Search
Have an existing account? Sign In
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
TechReport.gr > Technology > Η DeepSeek εισάγει υπερ-συνδέσεις με πολλαπλές περιορισμούς για το R2
Technology

Η DeepSeek εισάγει υπερ-συνδέσεις με πολλαπλές περιορισμούς για το R2

Marizas Dimitris
Last updated: 6 Ιανουαρίου 2026 17:27
Marizas Dimitris
Share
Η DeepSeek εισάγει υπερ-συνδέσεις με πολλαπλές περιορισμούς για το R2
Η DeepSeek εισάγει υπερ-συνδέσεις με πολλαπλές περιορισμούς για το R2
SHARE


Λίγο πριν την έναρξη του νέου έτους, η κοινότητα της τεχνητής νοημοσύνης εισήχθη σε μια πιθανή ανακάλυψη στην εκπαίδευση μοντέλων. Μια ομάδα ερευνητών από την κινεζική εταιρεία AI DeepSeek κυκλοφόρησε ένα χαρτί περιγράφοντας μια νέα αρχιτεκτονική προσέγγιση που ονομάζεται Manifold-Constrained Hyper-Connections ή mHC για συντομία. Αυτή η νέα μεθοδολογία μπορεί να παρέχει στους μηχανικούς μια διαδρομή για να κατασκευάσουν και να κλιμακώσουν μεγάλα γλωσσικά μοντέλα χωρίς το απαγορευτικό υπολογιστικό κόστος και το κεφάλαιο που συνήθως απαιτείται.

Το DeepSeek κατέλαβε για πρώτη φορά τα πολιτιστικά φώτα πριν από ένα χρόνο με την κυκλοφορία του R1. Αυτό το μοντέλο συναγωνιζόταν τις δυνατότητες του o1 του OpenAI, αλλά σύμφωνα με πληροφορίες εκπαιδεύτηκε με ένα κλάσμα του κόστους. Η κυκλοφορία προκάλεσε σοκ στους προγραμματιστές που εδρεύουν στις ΗΠΑ, επειδή αμφισβήτησε την υπόθεση ότι μόνο τεράστια αποθέματα κεφαλαίου και υλικού θα μπορούσαν να παράγουν τεχνητή νοημοσύνη αιχμής. Το πρόσφατα δημοσιευμένο χαρτί mHC, που φιλοξενείται στον διακομιστή προεκτύπωσης arXiv, θα μπορούσε να χρησιμεύσει ως το τεχνολογικό πλαίσιο για το επερχόμενο μοντέλο της DeepSeek, R2. Το μοντέλο R2 αναμενόταν αρχικά στα μέσα του 2025 αλλά αναβλήθηκε, σύμφωνα με πληροφορίες λόγω ανησυχιών του Διευθύνοντος Συμβούλου Liang Wenfeng σχετικά με την απόδοση και την περιορισμένη πρόσβαση της Κίνας σε προηγμένα τσιπ τεχνητής νοημοσύνης.

Το νέο έγγραφο επιχειρεί να γεφυρώσει ένα περίπλοκο τεχνικό κενό που επί του παρόντος εμποδίζει την επεκτασιμότητα της τεχνητής νοημοσύνης. Τα μεγάλα γλωσσικά μοντέλα είναι χτισμένα σε νευρωνικά δίκτυα σχεδιασμένα να διατηρούν σήματα σε πολλά επίπεδα. Ωστόσο, καθώς το μοντέλο μεγαλώνει και προστίθενται περισσότερα στρώματα, το σήμα μπορεί να εξασθενήσει ή να υποβαθμιστεί, αυξάνοντας τον κίνδυνο να μετατραπεί σε θόρυβο. Οι ερευνητές το παρομοιάζουν με ένα παιχνίδι «τηλεφώνου»: όσο περισσότεροι άνθρωποι εμπλέκονται στην αλυσίδα, τόσο μεγαλύτερη είναι η πιθανότητα να μπερδευτεί ή να αλλοιωθεί το αρχικό μήνυμα. Η βασική πρόκληση της μηχανικής είναι η βελτιστοποίηση της αντιστάθμισης μεταξύ πλαστικότητας και σταθερότητας, διασφαλίζοντας ότι τα σήματα διατηρούνται σε όσο το δυνατόν περισσότερα στρώματα χωρίς υποβάθμιση.

Μείνετε μπροστά από την καμπύλη!

Μην χάσετε τις πιο πρόσφατες πληροφορίες, τάσεις και αναλύσεις στον κόσμο των δεδομένων, της τεχνολογίας και των startups. Εγγραφείτε στο ενημερωτικό μας δελτίο και λάβετε αποκλειστικό περιεχόμενο απευθείας στα εισερχόμενά σας.

Οι συγγραφείς της εργασίας, συμπεριλαμβανομένου του Διευθύνοντος Συμβούλου Liang Wenfeng, έχτισαν την έρευνά τους πάνω σε υπερσυνδέσεις (HCs), ένα πλαίσιο που εισήχθη το 2024 από ερευνητές της ByteDance. Τα τυπικά HC διαφοροποιούν τα κανάλια μέσω των οποίων τα επίπεδα νευρωνικών δικτύων μοιράζονται πληροφορίες, αλλά εισάγουν τον κίνδυνο απώλειας σήματος και συνοδεύονται από υψηλό κόστος μνήμης που καθιστά δύσκολη την εφαρμογή τους σε κλίμακα. Η αρχιτεκτονική mHC του DeepSeek στοχεύει να το λύσει περιορίζοντας την υπερσυνδεσιμότητα μέσα σε ένα μοντέλο. Αυτή η προσέγγιση διατηρεί την πληροφοριακή πολυπλοκότητα που επιτρέπουν οι HC ενώ παρακάμπτει τα ζητήματα της μνήμης, επιτρέποντας την εκπαίδευση εξαιρετικά πολύπλοκων μοντέλων με τρόπο πρακτικό ακόμη και για προγραμματιστές με περιορισμένους πόρους.

Το ντεμπούτο του πλαισίου mHC υποδηλώνει μια στροφή στην εξέλιξη της ανάπτυξης AI. Μέχρι πρόσφατα, η επικρατούσα σοφία του κλάδου πίστευε ότι μόνο οι πιο πλούσιες εταιρείες είχαν την οικονομική δυνατότητα να κατασκευάσουν μοντέλα συνόρων. Το DeepSeek συνεχίζει να αποδεικνύει ότι οι καινοτομίες μπορούν να επιτευχθούν μέσω έξυπνης μηχανικής και όχι ωμής οικονομικής δύναμης. Δημοσιεύοντας αυτήν την έρευνα, το DeepSeek έχει διαθέσει τη μέθοδο mHC σε μικρότερους προγραμματιστές, εκδημοκρατίζοντας ενδεχομένως την πρόσβαση σε προηγμένες δυνατότητες AI, εάν αυτή η αρχιτεκτονική αποδειχθεί επιτυχημένη στο αναμενόμενο μοντέλο R2.


Πίστωση επιλεγμένης εικόνας



VIA: DataConomy.com

Ο Hideo Kojima βλέπει τη δημιουργία μαζί με την τεχνητή νοημοσύνη ως τον τρόπο να παραμείνετε ένα βήμα μπροστά στο μέλλον
Το επερχόμενο MacBook χαμηλού κόστους της Apple δοκιμάστηκε με A15 Bionic, καθιστώντας το πιο αργό από το iPad τρέχουσας γενιάς, οι εκδόσεις λιανικής που λέγεται ότι διαθέτουν ένα A18 Pro
Ανατροπή στον κόσμο του περιεχομένου: Το X ετοιμάζει ΜΥΘΕΣΥΝΔΕΣΙΜΕΣ αμοιβές για creators – Έρχεται να πάρει τον θρόνο από το YouTube!
CES 2026 LIVE: Ανακαλύψτε τώρα τα επαναστατικά gadgets και τις τεχνολογικές εξελίξεις που θα σας αφήσουν άφωνους!
«Ανατροπή στον Διαστημικό Ανταγωνισμό: Ο Αντίπαλος του Starlink Αποκαλύπτει την Ταχύτερη Δορυφορική Κεραία!»
TAGGED:βαθιά αναζήτησηΌλα συμπεριλαμβάνονται

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.
[mc4wp_form]
By signing up, you agree to our Terms of Use and acknowledge the data practices in our Privacy Policy. You may unsubscribe at any time.
Share This Article
Facebook Copy Link Print
Share
ByMarizas Dimitris
Follow:
Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες. Λατρεύει να εξερευνά νέες ιδέες, να επιλύει σύνθετα προβλήματα και να βρίσκει τρόπους ώστε η τεχνολογία να γίνεται πιο ανθρώπινη, απολαυστική και προσιτή για όλους. Στον ελεύθερο χρόνο του ασχολείται με το σκάκι και το poker, απολαμβάνοντας την στρατηγική και τη δημιουργική σκέψη που απαιτούν.
Previous Article «Δείτε πώς η Hyundai φέρνει ανθρωποειδή ρομπότ στα εργοστάσιά της: Είναι η αρχή μιας νέας εποχής;» «Δείτε πώς η Hyundai φέρνει ανθρωποειδή ρομπότ στα εργοστάσιά της: Είναι η αρχή μιας νέας εποχής;»
Next Article Η Sedgwick επιβεβαιώνει την παραβίαση στη θυγατρική της κυβερνητικής εργολάβου Η Sedgwick επιβεβαιώνει την παραβίαση στη θυγατρική της κυβερνητικής εργολάβου
Δεν υπάρχουν Σχόλια

Αφήστε μια απάντηση Ακύρωση απάντησης

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Stay Connected

248.1KLike
69.1KFollow
134KPin
54.3KFollow
banner banner
Create an Amazing Newspaper
Discover thousands of options, easy to customize layouts, one-click to import demo and much more.
Learn More

Latest News

Η Sedgwick επιβεβαιώνει την παραβίαση στη θυγατρική της κυβερνητικής εργολάβου
Η Sedgwick επιβεβαιώνει την παραβίαση στη θυγατρική της κυβερνητικής εργολάβου
Security
«Δείτε πώς η Hyundai φέρνει ανθρωποειδή ρομπότ στα εργοστάσιά της: Είναι η αρχή μιας νέας εποχής;»
«Δείτε πώς η Hyundai φέρνει ανθρωποειδή ρομπότ στα εργοστάσιά της: Είναι η αρχή μιας νέας εποχής;»
Health Science Technology
Η Amazon βγάζει 200 ​​$ για το M4 MacBook Air, ξεκινώντας από 799 $
Η Amazon βγάζει 200 ​​$ για το M4 MacBook Air, ξεκινώντας από 799 $
iPhone - iOS
Θα μου λείψουν νέα τηλέφωνα ASUS το 2026 για αυτόν τον ένα λόγο
Android Technology

You Might also Like

Ανακαλύψτε το Κρυφό Αδύναμο Σημείο του DNA: Ένας Μυστικός Κόσμος που Αλλάζει Όλα!
Technology

Ανακαλύψτε το Κρυφό Αδύναμο Σημείο του DNA: Ένας Μυστικός Κόσμος που Αλλάζει Όλα!

Marizas Dimitris
Marizas Dimitris
6 Min Read
Το Lemon Slice συλλέγει 10,5 εκατομμύρια δολάρια από την YC και τη Matrix για να αναπτύξει την τεχνολογία ψηφιακού avatar της
Technology

Το Lemon Slice συλλέγει 10,5 εκατομμύρια δολάρια από την YC και τη Matrix για να αναπτύξει την τεχνολογία ψηφιακού avatar της

Marizas Dimitris
Marizas Dimitris
6 Min Read
Το WhatsApp κυκλοφορεί το πακέτο αυτοκόλλητων 2026 και τα πυροτεχνήματα βιντεοκλήσεων
Technology

Το WhatsApp κυκλοφορεί το πακέτο αυτοκόλλητων 2026 και τα πυροτεχνήματα βιντεοκλήσεων

Marizas Dimitris
Marizas Dimitris
5 Min Read
//

We influence 20 million users and is the number one business and technology news network on the planet

Quick Link

  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
  • Blog
  • My Bookmarks
  • Customize Interests
  • Home Technology
  • Contact
  • Technology Home 2
  • Technology Home 3
  • Technology Home 4
  • Technology Home 5

Support

  • Home
  • Πολιτική απορρήτου
  • Σχετικά με εμάς
  • Contact With TechReport
  • Greek Live Channels IPTV 2025

Sign Up for Our Newsletter

Subscribe to our newsletter to get our newest articles instantly!

[mc4wp_form id=”1616″]

TechReport.grTechReport.gr
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Join Us!
Subscribe to our newsletter and never miss our latest news, podcasts etc..
[mc4wp_form]
Zero spam, Unsubscribe at any time.
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?