By using this site, you agree to the Privacy Policy and Terms of Use.
Accept
TechReport.grTechReport.grTechReport.gr
Search
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Reading: Η DeepSeek εισάγει υπερ-συνδέσεις με πολλαπλές περιορισμούς για το R2
Share
Sign In
Notification Show More
Font ResizerAa
TechReport.grTechReport.gr
Font ResizerAa
Search
Have an existing account? Sign In
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
TechReport.gr > Technology > Η DeepSeek εισάγει υπερ-συνδέσεις με πολλαπλές περιορισμούς για το R2
Technology

Η DeepSeek εισάγει υπερ-συνδέσεις με πολλαπλές περιορισμούς για το R2

Marizas Dimitris
Last updated: 6 Ιανουαρίου 2026 17:27
Marizas Dimitris
Share
Η DeepSeek εισάγει υπερ-συνδέσεις με πολλαπλές περιορισμούς για το R2
Η DeepSeek εισάγει υπερ-συνδέσεις με πολλαπλές περιορισμούς για το R2
SHARE


Λίγο πριν την έναρξη του νέου έτους, η κοινότητα της τεχνητής νοημοσύνης εισήχθη σε μια πιθανή ανακάλυψη στην εκπαίδευση μοντέλων. Μια ομάδα ερευνητών από την κινεζική εταιρεία AI DeepSeek κυκλοφόρησε ένα χαρτί περιγράφοντας μια νέα αρχιτεκτονική προσέγγιση που ονομάζεται Manifold-Constrained Hyper-Connections ή mHC για συντομία. Αυτή η νέα μεθοδολογία μπορεί να παρέχει στους μηχανικούς μια διαδρομή για να κατασκευάσουν και να κλιμακώσουν μεγάλα γλωσσικά μοντέλα χωρίς το απαγορευτικό υπολογιστικό κόστος και το κεφάλαιο που συνήθως απαιτείται.

Το DeepSeek κατέλαβε για πρώτη φορά τα πολιτιστικά φώτα πριν από ένα χρόνο με την κυκλοφορία του R1. Αυτό το μοντέλο συναγωνιζόταν τις δυνατότητες του o1 του OpenAI, αλλά σύμφωνα με πληροφορίες εκπαιδεύτηκε με ένα κλάσμα του κόστους. Η κυκλοφορία προκάλεσε σοκ στους προγραμματιστές που εδρεύουν στις ΗΠΑ, επειδή αμφισβήτησε την υπόθεση ότι μόνο τεράστια αποθέματα κεφαλαίου και υλικού θα μπορούσαν να παράγουν τεχνητή νοημοσύνη αιχμής. Το πρόσφατα δημοσιευμένο χαρτί mHC, που φιλοξενείται στον διακομιστή προεκτύπωσης arXiv, θα μπορούσε να χρησιμεύσει ως το τεχνολογικό πλαίσιο για το επερχόμενο μοντέλο της DeepSeek, R2. Το μοντέλο R2 αναμενόταν αρχικά στα μέσα του 2025 αλλά αναβλήθηκε, σύμφωνα με πληροφορίες λόγω ανησυχιών του Διευθύνοντος Συμβούλου Liang Wenfeng σχετικά με την απόδοση και την περιορισμένη πρόσβαση της Κίνας σε προηγμένα τσιπ τεχνητής νοημοσύνης.

Το νέο έγγραφο επιχειρεί να γεφυρώσει ένα περίπλοκο τεχνικό κενό που επί του παρόντος εμποδίζει την επεκτασιμότητα της τεχνητής νοημοσύνης. Τα μεγάλα γλωσσικά μοντέλα είναι χτισμένα σε νευρωνικά δίκτυα σχεδιασμένα να διατηρούν σήματα σε πολλά επίπεδα. Ωστόσο, καθώς το μοντέλο μεγαλώνει και προστίθενται περισσότερα στρώματα, το σήμα μπορεί να εξασθενήσει ή να υποβαθμιστεί, αυξάνοντας τον κίνδυνο να μετατραπεί σε θόρυβο. Οι ερευνητές το παρομοιάζουν με ένα παιχνίδι «τηλεφώνου»: όσο περισσότεροι άνθρωποι εμπλέκονται στην αλυσίδα, τόσο μεγαλύτερη είναι η πιθανότητα να μπερδευτεί ή να αλλοιωθεί το αρχικό μήνυμα. Η βασική πρόκληση της μηχανικής είναι η βελτιστοποίηση της αντιστάθμισης μεταξύ πλαστικότητας και σταθερότητας, διασφαλίζοντας ότι τα σήματα διατηρούνται σε όσο το δυνατόν περισσότερα στρώματα χωρίς υποβάθμιση.

Μείνετε μπροστά από την καμπύλη!

Μην χάσετε τις πιο πρόσφατες πληροφορίες, τάσεις και αναλύσεις στον κόσμο των δεδομένων, της τεχνολογίας και των startups. Εγγραφείτε στο ενημερωτικό μας δελτίο και λάβετε αποκλειστικό περιεχόμενο απευθείας στα εισερχόμενά σας.

Οι συγγραφείς της εργασίας, συμπεριλαμβανομένου του Διευθύνοντος Συμβούλου Liang Wenfeng, έχτισαν την έρευνά τους πάνω σε υπερσυνδέσεις (HCs), ένα πλαίσιο που εισήχθη το 2024 από ερευνητές της ByteDance. Τα τυπικά HC διαφοροποιούν τα κανάλια μέσω των οποίων τα επίπεδα νευρωνικών δικτύων μοιράζονται πληροφορίες, αλλά εισάγουν τον κίνδυνο απώλειας σήματος και συνοδεύονται από υψηλό κόστος μνήμης που καθιστά δύσκολη την εφαρμογή τους σε κλίμακα. Η αρχιτεκτονική mHC του DeepSeek στοχεύει να το λύσει περιορίζοντας την υπερσυνδεσιμότητα μέσα σε ένα μοντέλο. Αυτή η προσέγγιση διατηρεί την πληροφοριακή πολυπλοκότητα που επιτρέπουν οι HC ενώ παρακάμπτει τα ζητήματα της μνήμης, επιτρέποντας την εκπαίδευση εξαιρετικά πολύπλοκων μοντέλων με τρόπο πρακτικό ακόμη και για προγραμματιστές με περιορισμένους πόρους.

Το ντεμπούτο του πλαισίου mHC υποδηλώνει μια στροφή στην εξέλιξη της ανάπτυξης AI. Μέχρι πρόσφατα, η επικρατούσα σοφία του κλάδου πίστευε ότι μόνο οι πιο πλούσιες εταιρείες είχαν την οικονομική δυνατότητα να κατασκευάσουν μοντέλα συνόρων. Το DeepSeek συνεχίζει να αποδεικνύει ότι οι καινοτομίες μπορούν να επιτευχθούν μέσω έξυπνης μηχανικής και όχι ωμής οικονομικής δύναμης. Δημοσιεύοντας αυτήν την έρευνα, το DeepSeek έχει διαθέσει τη μέθοδο mHC σε μικρότερους προγραμματιστές, εκδημοκρατίζοντας ενδεχομένως την πρόσβαση σε προηγμένες δυνατότητες AI, εάν αυτή η αρχιτεκτονική αποδειχθεί επιτυχημένη στο αναμενόμενο μοντέλο R2.


Πίστωση επιλεγμένης εικόνας



VIA: DataConomy.com

Η Samsung ρίχνει μπάλες μπάσκετ σε αναδιπλούμενες οθόνες OLED για να αποδείξει την αντοχή τους
Πόσο διαρκεί η θερμική πάστα όταν ανοιχτεί;
CES 2026: Οι νέες δυνατότητες του Galaxy στοχεύουν στον έγκαιρο εντοπισμό των συμπτωμάτων άνοιας
Οι Αμερικανοί μεταβαίνουν σε VPN κατά πλήθος
Ανατροπή στην αγορά: Έρχεται ισχυρή ενίσχυση σε Ελλάδα, ΝΑ Ευρώπη, Βέλγιο & Λουξεμβούργο!
TAGGED:βαθιά αναζήτησηΌλα συμπεριλαμβάνονται

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.
[mc4wp_form]
By signing up, you agree to our Terms of Use and acknowledge the data practices in our Privacy Policy. You may unsubscribe at any time.
Share This Article
Facebook Copy Link Print
Share
ByMarizas Dimitris
Follow:
Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες. Λατρεύει να εξερευνά νέες ιδέες, να επιλύει σύνθετα προβλήματα και να βρίσκει τρόπους ώστε η τεχνολογία να γίνεται πιο ανθρώπινη, απολαυστική και προσιτή για όλους. Στον ελεύθερο χρόνο του ασχολείται με το σκάκι και το poker, απολαμβάνοντας την στρατηγική και τη δημιουργική σκέψη που απαιτούν.
Previous Article «Δείτε πώς η Hyundai φέρνει ανθρωποειδή ρομπότ στα εργοστάσιά της: Είναι η αρχή μιας νέας εποχής;» «Δείτε πώς η Hyundai φέρνει ανθρωποειδή ρομπότ στα εργοστάσιά της: Είναι η αρχή μιας νέας εποχής;»
Next Article Η Sedgwick επιβεβαιώνει την παραβίαση στη θυγατρική της κυβερνητικής εργολάβου Η Sedgwick επιβεβαιώνει την παραβίαση στη θυγατρική της κυβερνητικής εργολάβου
Δεν υπάρχουν Σχόλια

Αφήστε μια απάντηση Ακύρωση απάντησης

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Stay Connected

248.1KLike
69.1KFollow
134KPin
54.3KFollow
banner banner
Create an Amazing Newspaper
Discover thousands of options, easy to customize layouts, one-click to import demo and much more.
Learn More

Latest News

Μια ανακάλυψη μιας φοράς στη γενιά θα μπορούσε να μεταμορφώσει το μέλλον της γαλακτοκομίας
Μια ανακάλυψη μιας φοράς στη γενιά θα μπορούσε να μεταμορφώσει το μέλλον της γαλακτοκομίας
Health Science
Η Nvidia φέρεται να ζητά από τους Κινέζους πελάτες να πληρώσουν προκαταβολικά για τα τσιπ H200 AI
Η Nvidia φέρεται να ζητά από τους Κινέζους πελάτες να πληρώσουν προκαταβολικά για τα τσιπ H200 AI
Technology
«Μείνετε στο Σαλόνι: Οι 5 Εκπομπές που Θέλουν να Ξεχάσετε τον Καύσωνα στην Αυστραλία αυτό το Σαββατοκύριακο!»
«Μείνετε στο Σαλόνι: Οι 5 Εκπομπές που Θέλουν να Ξεχάσετε τον Καύσωνα στην Αυστραλία αυτό το Σαββατοκύριακο!»
Android Phones Technology
«Deutsche Bank: Γιατί οι Ελληνικές Τράπεζες Είναι η Μεγάλη Ευκαιρία που δεν Πρέπει να Χάσετε!»
«Deutsche Bank: Γιατί οι Ελληνικές Τράπεζες Είναι η Μεγάλη Ευκαιρία που δεν Πρέπει να Χάσετε!»
Business

You Might also Like

Το τσιπ Samsung Galaxy S26 Exynos 2600 θα μπορούσε να περιοριστεί σε μία μόνο χώρα
AndroidTechnology

Το τσιπ Samsung Galaxy S26 Exynos 2600 θα μπορούσε να περιοριστεί σε μία μόνο χώρα

Marizas Dimitris
Marizas Dimitris
4 Min Read
Η Valve στοχεύει να φέρει τη βιβλιοθήκη Steam σε Android και Mac μέσω εξομοίωσης
Technology

Η Valve στοχεύει να φέρει τη βιβλιοθήκη Steam σε Android και Mac μέσω εξομοίωσης

Marizas Dimitris
Marizas Dimitris
3 Min Read
AndroidComputerInternetPhonesPopular NowSamsungTechnology

Samsung Internet Browser για Windows – Είναι πλέον γεγονός

Marizas Dimitris
Marizas Dimitris
11 Min Read
//

We influence 20 million users and is the number one business and technology news network on the planet

Quick Link

  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
  • Blog
  • My Bookmarks
  • Customize Interests
  • Home Technology
  • Contact
  • Technology Home 2
  • Technology Home 3
  • Technology Home 4
  • Technology Home 5

Support

  • Home
  • Πολιτική απορρήτου
  • Σχετικά με εμάς
  • Contact With TechReport
  • Greek Live Channels IPTV 2025

Sign Up for Our Newsletter

Subscribe to our newsletter to get our newest articles instantly!

[mc4wp_form id=”1616″]

TechReport.grTechReport.gr
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Join Us!
Subscribe to our newsletter and never miss our latest news, podcasts etc..
[mc4wp_form]
Zero spam, Unsubscribe at any time.
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?