Το τελευταίο μοντέλο του OpenAI έδειξε μια απροσδόκητη ικανότητα επίλυσης μαθηματικών προβλημάτων υψηλού επιπέδου, σύμφωνα με δοκιμές που διενεργήθηκαν από μηχανικό λογισμικού και πρώην ερευνητή quant Νιλ Σομάνι.
Ο Somani παρατήρησε ότι το μοντέλο δημιουργεί μια πλήρη λύση μετά από 15 λεπτά επεξεργασίας ενός προβλήματος στο ChatGPT, επισημοποιώντας στη συνέχεια την απόδειξη με το εργαλείο Harmonic, επιβεβαιώνοντας την ακρίβειά του. Δήλωσε ότι στόχευε να δημιουργήσει μια βάση για την ικανότητα των μεγάλων γλωσσικών μοντέλων (LLM) να επιλύουν ανοιχτά μαθηματικά προβλήματα.
Η αλυσίδα σκέψης του μοντέλου επικαλέστηκε μαθηματικά αξιώματα, όπως ο τύπος του Legendre, το αξίωμα του Bertrand και το θεώρημα του Star of David. Εντόπισε μια ανάρτηση Math Overflow του 2013 από τον μαθηματικό του Χάρβαρντ Noam Elkies, η οποία προσέφερε τη λύση ενός παρόμοιου προβλήματος, αλλά η τελική απόδειξη του ChatGPT διέφερε και παρείχε μια πιο ολοκληρωμένη λύση σε μια εκδοχή ενός προβλήματος που έθεσε ο μαθηματικός Paul Erdős.
Από την κυκλοφορία του GPT 5.2, το οποίο ο Somani περιέγραψε ως «ανέκδοτα πιο επιδέξιος στη μαθηματική συλλογιστική από προηγούμενες επαναλήψεις», ένας αυξανόμενος όγκος λυμένων προβλημάτων έχει εγείρει ερωτήματα σχετικά με την ικανότητα των LLM να προάγουν την ανθρώπινη γνώση. Ο Somani εστίασε στα προβλήματα του Erdős, μια συλλογή με περισσότερες από 1.000 εικασίες που διατηρούνται στο διαδίκτυο, οι οποίες ποικίλλουν ως προς το θέμα και τη δυσκολία.
Οι πρώτες αυτόνομες λύσεις σε αυτά τα προβλήματα προέκυψαν τον Νοέμβριο από το AlphaEvolve, ένα μοντέλο που τροφοδοτείται από τους Διδύμους. Πιο πρόσφατα, ο Somani και άλλοι βρήκαν το GPT 5.2 ικανό με μαθηματικά υψηλού επιπέδου. Από τον Δεκέμβριο, 15 προβλήματα στον ιστότοπο του Erdős έχουν αλλάξει από «ανοιχτό» σε «λυμένο», με 11 λύσεις να πιστώνουν μοντέλα τεχνητής νοημοσύνης.
Ο μαθηματικός Terence Tao, στο δικό του Σελίδα GitHubσημείωσε οκτώ προβλήματα όπου τα μοντέλα τεχνητής νοημοσύνης σημείωσαν σημαντική αυτόνομη πρόοδο και έξι περιπτώσεις όπου η πρόοδος περιελάμβανε εντοπισμό και αξιοποίηση προηγούμενης έρευνας. Ο Tao υπέθεσε στο Mastodon ότι η κλιμακωτή φύση των συστημάτων τεχνητής νοημοσύνης τα καθιστά «καλύτερα κατάλληλα για συστηματική εφαρμογή στη «μακριά ουρά» των σκοτεινών προβλημάτων Erdős, πολλά από τα οποία έχουν στην πραγματικότητα άμεσες λύσεις», προσθέτοντας ότι «πολλά από αυτά τα ευκολότερα προβλήματα του Erdős είναι πλέον πιο πιθανό να λυθούν με καθαρά ανθρώπινα μέσα ή με υβριδικές μεθόδους».
Μια κινητήρια δύναμη σε αυτή την πρόοδο είναι μια στροφή προς την επισημοποίηση, μια διαδικασία έντασης εργασίας για την επαλήθευση και την επέκταση του μαθηματικού συλλογισμού. Αν και δεν απαιτείται AI, νέα αυτοματοποιημένα εργαλεία έχουν απλοποιήσει αυτή τη διαδικασία. Ο βοηθός απόδειξης ανοιχτού κώδικα Lean, που αναπτύχθηκε στο Microsoft Research το 2013, έχει αποκτήσει ευρεία χρήση για την επισημοποίηση αποδείξεων και εργαλεία τεχνητής νοημοσύνης όπως το Aristotle της Harmonic στοχεύουν να αυτοματοποιήσουν μεγάλο μέρος αυτής της εργασίας.
Ο Tudor Achim, ιδρυτής της Harmonic, δήλωσε ότι η δέσμευση μαθηματικών και καθηγητών επιστήμης υπολογιστών με εργαλεία τεχνητής νοημοσύνης είχε μεγαλύτερη σημασία από τον αριθμό των λυμένων προβλημάτων Erdős. Ο Achim είπε, «Αυτοί οι άνθρωποι έχουν τη φήμη να προστατεύουν, οπότε όταν λένε ότι χρησιμοποιούν το Aristotle ή χρησιμοποιούν το ChatGPT, αυτό είναι αληθινή απόδειξη».
VIA: DataConomy.com


