By using this site, you agree to the Privacy Policy and Terms of Use.
Accept
TechReport.grTechReport.grTechReport.gr
Search
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Reading: Τα τυπικά μοντέλα AI αποτυγχάνουν σε απλά μαθηματικά χωρίς εξειδικευμένη εκπαίδευση
Share
Sign In
Notification Show More
Font ResizerAa
TechReport.grTechReport.gr
Font ResizerAa
Search
Have an existing account? Sign In
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
TechReport.gr > Technology > Τα τυπικά μοντέλα AI αποτυγχάνουν σε απλά μαθηματικά χωρίς εξειδικευμένη εκπαίδευση
Technology

Τα τυπικά μοντέλα AI αποτυγχάνουν σε απλά μαθηματικά χωρίς εξειδικευμένη εκπαίδευση

Marizas Dimitris
Last updated: 1 Ιανουαρίου 2026 04:54
Marizas Dimitris
Share
Τα τυπικά μοντέλα AI αποτυγχάνουν σε απλά μαθηματικά χωρίς εξειδικευμένη εκπαίδευση
Τα τυπικά μοντέλα AI αποτυγχάνουν σε απλά μαθηματικά χωρίς εξειδικευμένη εκπαίδευση
SHARE


Τα μεγάλα γλωσσικά μοντέλα έχουν δυσκολευτεί με τον πολυψήφιο πολλαπλασιασμό χωρίς εξειδικευμένες μεθόδους εκπαίδευσης, παρά την ικανότητά τους να χειρίζονται περίπλοκες εργασίες κωδικοποίησης και συλλογισμού, σύμφωνα με πρόσφατη μελέτη.

Έρευνα που δημοσιεύτηκε στο arXiv Ο διακομιστής προεκτύπωσης από τους Xiaoyan Bai και Chenhao Tan του Πανεπιστημίου του Σικάγο, μαζί με συνεργάτες από το MIT, το Πανεπιστήμιο του Χάρβαρντ, το Πανεπιστήμιο του Waterloo και το Google DeepMind, εντόπισαν τους λόγους για αυτόν τον περιορισμό και βρήκαν λύσεις.

Τα τυπικά μοντέλα μεγάλων γλωσσών πέτυχαν λιγότερο από 1% ακρίβεια κατά τον πολλαπλασιασμό δύο τετραψήφιων αριθμών, ακόμη και με αυξημένα επίπεδα έως το 12. Αυτά τα μοντέλα συνέκλιναν σε ένα “τοπικό βέλτιστο”, αποτυγχάνοντας να αποθηκεύσουν και να ανακτήσουν ενδιάμεσους υπολογισμούς που είναι απαραίτητοι για πολυψήφιο πολλαπλασιασμό, οι οποίοι κατηγοριοποιούνται ως εξαρτήσεις μεγάλης εμβέλειας.

Μείνετε μπροστά από την καμπύλη!

Μην χάσετε τις πιο πρόσφατες πληροφορίες, τάσεις και αναλύσεις στον κόσμο των δεδομένων, της τεχνολογίας και των startups. Εγγραφείτε στο ενημερωτικό μας δελτίο και λάβετε αποκλειστικό περιεχόμενο απευθείας στα εισερχόμενά σας.

Αντίθετα, ένα μοντέλο που εκπαιδεύτηκε με τη μέθοδο Implicit Chain of Thought (ICoT) πέτυχε 100% ακρίβεια. Το μοντέλο ICoT έδειξε την ικανότητα παρακολούθησης εξαρτήσεων μεγάλης εμβέλειας και εσωτερίκευσης των διαδικασιών συλλογισμού αφαιρώντας σταδιακά τα ενδιάμεσα βήματα συλλογισμού κατά τη διάρκεια της εκπαίδευσης. Η ερευνητική ομάδα αποκωδικοποίησε ενδιάμεσες τιμές, όπως τρέχοντα αθροίσματα, από τις εσωτερικές καταστάσεις του μοντέλου ICoT, κάτι που δεν ήταν δυνατό με το τυπικό μοντέλο μικρορύθμισης.

Το μοντέλο ICoT οργάνωσε την προσοχή του σε διακριτές διαδρομές, υπολογίζοντας τα προϊόντα ζευγών ψηφίων σε πρώιμα επίπεδα και αποθηκεύοντάς τα σε συγκεκριμένες τοποθεσίες για ανάκτηση σε μεταγενέστερα επίπεδα. Αυτό δημιούργησε μια αποτελεσματική εσωτερική δομή πολλαπλασιασμού. Η μελέτη διαπίστωσε επίσης ότι το μοντέλο ICoT αντιπροσώπευε λειτουργίες χρησιμοποιώντας κομψές δομές, κωδικοποιώντας ψηφία ως κυματοειδείς μοτίβα (βάσεις Fourier) και οργανώνοντας την αριθμητική χωρικά. Κατά τον πολλαπλασιασμό των ζευγών ψηφίων, το μοντέλο χρησιμοποίησε φυσικά μια γεωμετρική πράξη που ονομάζεται άθροισμα Minkowski, η οποία δεν είχε προγραμματιστεί ρητά από τους ερευνητές.

Οι ερευνητές πέτυχαν ακρίβεια 99% σε ένα μοντέλο δύο επιπέδων εισάγοντας έναν τροποποιημένο στόχο εκπαίδευσης που δίδασκε στο μοντέλο να παρακολουθεί τα τρέχοντα ποσά σε κάθε βήμα, μεταφέροντας έτσι ενδιάμεσες τιμές και μερικά προϊόντα προς τα εμπρός. Αυτή η προσθήκη επέτρεψε στο μοντέλο να αναπτύξει μηχανισμούς παρόμοιους με τους ICoT, συμπεριλαμβανομένης της αποθήκευσης και ανάκτησης μερικών προϊόντων και της ταυτόχρονης παρακολούθησης ζευγών πολλαπλών ψηφίων.

Ο Chenhao Tan είπε, «Η έρευνά μας προσπαθεί να χαρτογραφήσει αυτό το έδαφος». Η μελέτη υπογραμμίζει ότι οι αρχιτεκτονικές γνώσεις και οι τεχνικές εκπαίδευσης μπορούν να ξεπεράσουν εμπόδια που η κλιμάκωση από μόνη της δεν μπορεί να αντιμετωπίσει, τονίζοντας τη σημασία της ενσωματωμένης καθοδήγησης για την προώθηση των δυνατοτήτων AI.

Τα ευρήματα φωτίζουν θεμελιώδεις πτυχές του τρόπου με τον οποίο τα μεγάλα γλωσσικά μοντέλα μαθαίνουν και «σκέφτονται», με το πρόβλημα εξάρτησης μακράς εμβέλειας να εκτείνεται πέρα ​​από την αριθμητική σε άλλες διαδοχικές εργασίες στη μοντελοποίηση γλώσσας.


Πίστωση επιλεγμένης εικόνας



VIA: DataConomy.com

Σχεδόν 80 ευρωπαϊκά πανεπιστήμια βαθιάς τεχνολογίας έφθασαν σε αποτιμήσεις 1 δισεκατομμυρίων δολαρίων ή 100 εκατομμύρια δολάρια σε έσοδα το 2025
Η Amazon λέει ότι δεν εγκαταλείπει ακόμη το Fire TV OS που βασίζεται στο Android
Ανακαλύψτε το ΕΠΑΝΑΣΤΑΤΙΚΟ SPEC III Update του Gran Turismo 7: Νέα Αυτοκίνητα, Εξερευνήσεις και Συναρπαστικά Modes που θα σας Αφήσουν άφωνους!
Δείτε πώς μοιάζουν τα επανασχεδιασμένα εικονίδια των Φωτογραφιών και των Χαρτών Google
Ανατρεπτική καινοτομία: Νέο 3D εκτυπωμένο υλικό σκληραίνει σε μόλις 3 μέρες – πώς αλλάζει τα πάντα!
TAGGED:μαθηματικάΌλα συμπεριλαμβάνονται

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.
[mc4wp_form]
By signing up, you agree to our Terms of Use and acknowledge the data practices in our Privacy Policy. You may unsubscribe at any time.
Share This Article
Facebook Copy Link Print
Share
ByMarizas Dimitris
Follow:
Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες. Λατρεύει να εξερευνά νέες ιδέες, να επιλύει σύνθετα προβλήματα και να βρίσκει τρόπους ώστε η τεχνολογία να γίνεται πιο ανθρώπινη, απολαυστική και προσιτή για όλους. Στον ελεύθερο χρόνο του ασχολείται με το σκάκι και το poker, απολαμβάνοντας την στρατηγική και τη δημιουργική σκέψη που απαιτούν.
Previous Article «Απόλαυσε επαγγελματικό εσπρέσο στο σπίτι σου με μόλις 145€! Μάθε πώς!» «Απόλαυσε επαγγελματικό εσπρέσο στο σπίτι σου με μόλις 145€! Μάθε πώς!»
Δεν υπάρχουν Σχόλια

Αφήστε μια απάντηση Ακύρωση απάντησης

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Stay Connected

248.1KLike
69.1KFollow
134KPin
54.3KFollow
banner banner
Create an Amazing Newspaper
Discover thousands of options, easy to customize layouts, one-click to import demo and much more.
Learn More

Latest News

«Απόλαυσε επαγγελματικό εσπρέσο στο σπίτι σου με μόλις 145€! Μάθε πώς!»
«Απόλαυσε επαγγελματικό εσπρέσο στο σπίτι σου με μόλις 145€! Μάθε πώς!»
Technology
Το Hubble αποκαλύπτει τον «χαμένο γαλαξία» που λάμπει με νεογέννητα αστέρια
Το Hubble αποκαλύπτει τον «χαμένο γαλαξία» που λάμπει με νεογέννητα αστέρια
Health Science
Προβλέψεις τεχνολογίας κινητής τηλεφωνίας 2026: Αναμένετε αλλαγές στην τεχνητή νοημοσύνη, τις τιμές και τα χαρακτηριστικά καθώς η αγορά εξελίσσεται
Προβλέψεις τεχνολογίας κινητής τηλεφωνίας 2026: Αναμένετε αλλαγές στην τεχνητή νοημοσύνη, τις τιμές και τα χαρακτηριστικά καθώς η αγορά εξελίσσεται
Android Technology
Το iOS 26 προσθέτει τη νέα εφαρμογή «Προεπισκόπηση» στο iPhone, ορίστε πώς τη χρησιμοποιώ
Το iOS 26 προσθέτει τη νέα εφαρμογή «Προεπισκόπηση» στο iPhone, ορίστε πώς τη χρησιμοποιώ
Apple

You Might also Like

Technology

«ΣΟΚ: Το επαναστατικό Linux laptop με Snapdragon X1 Elite ακυρώνεται λόγω απογοητευτικής απόδοσης!»

Marizas Dimitris
Marizas Dimitris
3 Min Read
AndroidTechnology

Έχετε έναν κωδικό έκπτωσης 100 $ από τη Meta που δεν λειτούργησε; Δεν είσαι μόνος — ιδού τι συνέβη

Marizas Dimitris
Marizas Dimitris
5 Min Read
«Ανακάλυψε τη Σύγκρουση: Γραφίτης ή Αφρός Υψηλής Πυκνότητας; Ποιο Κάλυμμα Στρώματος Saatva Είναι το Απόλυτο για Πλευρικούς Στρωτήρες;»
AndroidPhonesTechnology

«Ανακάλυψε τη Σύγκρουση: Γραφίτης ή Αφρός Υψηλής Πυκνότητας; Ποιο Κάλυμμα Στρώματος Saatva Είναι το Απόλυτο για Πλευρικούς Στρωτήρες;»

Marizas Dimitris
Marizas Dimitris
9 Min Read
//

We influence 20 million users and is the number one business and technology news network on the planet

Quick Link

  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
  • Blog
  • My Bookmarks
  • Customize Interests
  • Home Technology
  • Contact
  • Technology Home 2
  • Technology Home 3
  • Technology Home 4
  • Technology Home 5

Support

  • Home
  • Πολιτική απορρήτου
  • Σχετικά με εμάς
  • Contact With TechReport
  • Greek Live Channels IPTV 2025

Sign Up for Our Newsletter

Subscribe to our newsletter to get our newest articles instantly!

[mc4wp_form id=”1616″]

TechReport.grTechReport.gr
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Join Us!
Subscribe to our newsletter and never miss our latest news, podcasts etc..
[mc4wp_form]
Zero spam, Unsubscribe at any time.
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?