Close Menu
TechReport.grTechReport.gr
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology

Subscribe to Updates

Get the latest creative news from FooBar about art, design and business.

What's Hot
«Σοκαριστικές αποκαλύψεις: Η Ρωσία σκοπεύει να χτίσει πυρηνικό σταθμό στη Σελήνη πριν το 2036!»

«Σοκαριστικές αποκαλύψεις: Η Ρωσία σκοπεύει να χτίσει πυρηνικό σταθμό στη Σελήνη πριν το 2036!»

24 Δεκεμβρίου 2025
Το GPT-5.2 ξεπερνά τη βασική γραμμή του ειδικού διδακτορικού με 92% βαθμολογία επιστήμης

Το GPT-5.2 ξεπερνά τη βασική γραμμή του ειδικού διδακτορικού με 92% βαθμολογία επιστήμης

24 Δεκεμβρίου 2025
iOS 26.3: Η Επαναστατική Μέθοδος για Ανεπανάληπτη Μεταφορά Στοιχείων από iPhone σε Android!

Ανακαλύψτε το iOS 26.3: Εντυπωσιακή Third-Party Proximity Pairing Έρχεται στην Ευρώπη!

24 Δεκεμβρίου 2025
Facebook X (Twitter) Instagram
  • Home
  • Πολιτική απορρήτου
  • Σχετικά με εμάς
  • Contact With TechReport
  • Greek Live Channels IPTV 2025
Facebook X (Twitter) Instagram Pinterest Vimeo
TechReport.grTechReport.gr
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
TechReport.grTechReport.gr
Αρχική » Το GPT-5.2 ξεπερνά τη βασική γραμμή του ειδικού διδακτορικού με 92% βαθμολογία επιστήμης
Technology

Το GPT-5.2 ξεπερνά τη βασική γραμμή του ειδικού διδακτορικού με 92% βαθμολογία επιστήμης

Marizas DimitrisBy Marizas Dimitris24 Δεκεμβρίου 2025Δεν υπάρχουν Σχόλια3 Mins Read
Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
Το GPT-5.2 ξεπερνά τη βασική γραμμή του ειδικού διδακτορικού με 92% βαθμολογία επιστήμης
Το GPT-5.2 ξεπερνά τη βασική γραμμή του ειδικού διδακτορικού με 92% βαθμολογία επιστήμης
Share
Facebook Twitter LinkedIn Pinterest Tumblr Telegram WhatsApp Email


GPT-5.2 σκόραρε 92% σε ένα επιστημονικό σημείο αναφοράς “Google-Proof”, ξεπερνώντας σημαντικά το βασικό επίπεδο των ειδικών 70%. Το προηγμένο μοντέλο πέτυχε επίσης επιδόσεις με μετάλλια σε μεγάλους διεθνείς διαγωνισμούς, επιδεικνύοντας τις εξελισσόμενες ικανότητές του στην επιστημονική λογική.

Οι επιστήμονες χρησιμοποιούν εκτενώς αυτά τα συστήματα για εργασίες όπως αναζητήσεις βιβλιογραφίας σε διάφορους κλάδους και γλώσσες, καθώς και για πλοήγηση σε πολύπλοκες μαθηματικές αποδείξεις. Αυτή η εξέλιξη συχνά μειώνει την εργασία που συνήθως διαρκεί μέρες ή εβδομάδες σε λίγες μόνο ώρες. Το χαρτί, Πρώιμα επιστημονικά πειράματα επιτάχυνσης με GPT-5που δημοσιεύτηκε τον Νοέμβριο του 2025, παρέχει αρχικά στοιχεία ότι το GPT-5 μπορεί να επιταχύνει σημαντικά τις επιστημονικές ροές εργασιών.

Για περαιτέρω μέτρηση και πρόβλεψη της ικανότητας των μοντέλων τεχνητής νοημοσύνης να επιταχύνουν την επιστημονική έρευνα, οι προγραμματιστές εισήγαγαν το FrontierScience, ένα νέο σημείο αναφοράς που έχει σχεδιαστεί για την αξιολόγηση των επιστημονικών ικανοτήτων σε επίπεδο ειδικών. Το σημείο αναφοράς περιέχει ερωτήσεις γραμμένες και επαληθευμένες από ειδικούς στη φυσική, τη χημεία και τη βιολογία, εστιάζοντας στην πρωτοτυπία και τη δυσκολία.

Μείνετε μπροστά από την καμπύλη!

Μην χάσετε τις πιο πρόσφατες πληροφορίες, τάσεις και αναλύσεις στον κόσμο των δεδομένων, της τεχνολογίας και των startups. Εγγραφείτε στο ενημερωτικό μας δελτίο και λάβετε αποκλειστικό περιεχόμενο απευθείας στα εισερχόμενά σας.

Το FrontierScience διαθέτει δύο ξεχωριστά κομμάτια:

  • Ολυμπιάδα: Μετρά τις επιστημονικές συλλογιστικές ικανότητες σε στυλ διεθνών διαγωνισμών Ολυμπιάδας.
  • Ερευνα: Αξιολογεί τις πραγματικές δυνατότητες επιστημονικής έρευνας.

Σε αρχικές αξιολογήσεις, το GPT-5.2 αναδείχθηκε ως το μοντέλο με τις κορυφαίες επιδόσεις τόσο στο FrontierScience-Olympiad, με 77% και στο Research, με 25%. Αυτή η απόδοση το τοποθετεί μπροστά από άλλα μοντέλα αιχμής, συμπεριλαμβανομένων των Claude Opus 4.5 και Gemini 3 Pro. Τα αποτελέσματα υποδεικνύουν ότι τα τρέχοντα μοντέλα μπορούν να υποστηρίξουν δομημένες συλλογιστικές πτυχές της έρευνας, αν και απομένει σημαντική δουλειά για την ενίσχυση των δυνατοτήτων ανοιχτής σκέψης τους.

Το FrontierScience περιλαμβάνει πάνω από 700 ερωτήσεις κειμένου, με 160 σε χρυσό σύνολο, που εκτείνονται σε υποπεδία στη φυσική, τη χημεία και τη βιολογία. Το FrontierScience-Olympiad περιλαμβάνει 100 ερωτήσεις που έχουν σχεδιαστεί από κοινού από 42 διεθνείς Ολυμπιονίκες και προπονητές εθνικών ομάδων. Το FrontierScience-Research περιλαμβάνει 60 πρωτότυπες ερευνητικές επιμέρους εργασίες που αναπτύχθηκαν από 45 επιστήμονες διδάκτορες, συμπεριλαμβανομένων υποψηφίων διδακτόρων, καθηγητών και μεταδιδακτορικών ερευνητών.

Για το σύνολο της Ολυμπιάδας, η βαθμολόγηση πραγματοποιείται μέσω επαλήθευσης σύντομων απαντήσεων. Για το ερευνητικό κομμάτι, μια αρχιτεκτονική βασισμένη σε ρουμπρίκες με σύστημα βαθμολόγησης 10 σημείων αξιολογεί εργασίες ανοιχτού τύπου. Αυτή η ρουμπρίκα αξιολογεί τόσο την τελική απάντηση όσο και τα ενδιάμεσα βήματα συλλογισμού. Ένας βαθμολογητής που βασίζεται σε μοντέλο, το GPT-5, αξιολογεί τις απαντήσεις σε σχέση με αυτά τα κριτήρια. Η δημιουργία κάθε εργασίας περιελάμβανε την επιλογή έναντι εσωτερικών μοντέλων, τα οποία μπορεί να μεροληπτούν τις αξιολογήσεις έναντι συγκεκριμένων μοντέλων.

Τα βασικά αποτελέσματα απόδοσης περιλαμβάνουν:

  • Ακρίβεια FrontierScience-Olympiad:
    • GPT-5,2: 77,1%
    • Gemini 3 Pro: 76,1%
    • Claude Opus 4,5: 71,4%
  • Ακρίβεια FrontierScience-Research:
    • GPT-5,2: 25,2%
    • Claude Opus 4,5: 17,5%
    • Grok 4: 15,9%

Μεγαλύτεροι χρόνοι επεξεργασίας ή υψηλότερες προσπάθειες συλλογισμού, συσχετίστηκαν με βελτιωμένη ακρίβεια τόσο για το GPT-5.2 όσο και για το OpenAI o3. Για παράδειγμα, η ακρίβεια του GPT-5.2 στο FrontierScience-Olympiad αυξήθηκε από 67,5% στην προσπάθεια λογικής «Χαμηλή» σε 77,1% στην προσπάθεια «XHigh». Ομοίως, στο FrontierScience-Research, η ακρίβεια του GPT-5.2 αυξήθηκε από 18,2% στο “Χαμηλό” σε 25,2% στο “XHigh”.

Το FrontierScience επί του παρόντος εστιάζει σε περιορισμένες δηλώσεις προβλημάτων και δεν αξιολογεί τη δημιουργία νέων υποθέσεων ή αλληλεπιδράσεων με πολυτροπικά δεδομένα. Οι προγραμματιστές σχεδιάζουν να επαναλάβουν το σημείο αναφοράς, επεκτείνοντάς το σε νέους τομείς και ενσωματώνοντας περισσότερες πραγματικές αξιολογήσεις καθώς βελτιώνονται τα μοντέλα.


Πίστωση επιλεγμένης εικόνας



VIA: DataConomy.com

Related Posts


Το OpenAI σχεδιάζει να κυκλοφορήσει τα GPT-5.1, GPT-5.1 Reasoning και GPT-5.1 Pro
Security

Το OpenAI θα κυκλοφορήσει το GPT-5.2 την Τρίτη
Technology

Το OpenAI αντεπιτίθεται στην Google με το GPT-5.2 μετά το σημείωμα «κόκκινο κώδικα».
Technology
FrontierScience Gemini Google GPT-5 gpt-5.2 openAI
Share. Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram WhatsApp Email
Previous ArticleΑνακαλύψτε το iOS 26.3: Εντυπωσιακή Third-Party Proximity Pairing Έρχεται στην Ευρώπη!
Next Article «Σοκαριστικές αποκαλύψεις: Η Ρωσία σκοπεύει να χτίσει πυρηνικό σταθμό στη Σελήνη πριν το 2036!»
Marizas Dimitris
  • Website
  • Facebook

Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες. Λατρεύει να εξερευνά νέες ιδέες, να επιλύει σύνθετα προβλήματα και να βρίσκει τρόπους ώστε η τεχνολογία να γίνεται πιο ανθρώπινη, απολαυστική και προσιτή για όλους. Στον ελεύθερο χρόνο του ασχολείται με το σκάκι και το poker, απολαμβάνοντας την στρατηγική και τη δημιουργική σκέψη που απαιτούν.

Related Posts

«Σοκαριστικές αποκαλύψεις: Η Ρωσία σκοπεύει να χτίσει πυρηνικό σταθμό στη Σελήνη πριν το 2036!»
Health

«Σοκαριστικές αποκαλύψεις: Η Ρωσία σκοπεύει να χτίσει πυρηνικό σταθμό στη Σελήνη πριν το 2036!»

24 Δεκεμβρίου 2025
iOS 26.3: Η Επαναστατική Μέθοδος για Ανεπανάληπτη Μεταφορά Στοιχείων από iPhone σε Android!
Technology

Ανακαλύψτε το iOS 26.3: Εντυπωσιακή Third-Party Proximity Pairing Έρχεται στην Ευρώπη!

24 Δεκεμβρίου 2025
Google και Samsung το 2025: Μια καθοριστική χρονιά για τους μεγαλύτερους παίκτες του Android
Android

Google και Samsung το 2025: Μια καθοριστική χρονιά για τους μεγαλύτερους παίκτες του Android

24 Δεκεμβρίου 2025
Add A Comment
Leave A Reply Cancel Reply

Top Posts

Οδηγός για το Πρόγραμμα «Ψηφιακές Συναλλαγές Β’» (2025) – Όσα πρέπει να γνωρίζουμε

13 Νοεμβρίου 20251.156 Views

Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

30 Οκτωβρίου 2025570 Views
Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα οδηγός

Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους

12 Νοεμβρίου 2025468 Views
Stay In Touch
  • Facebook
  • YouTube
  • TikTok
  • WhatsApp
  • Twitter
  • Instagram
Latest News
«Σοκαριστικές αποκαλύψεις: Η Ρωσία σκοπεύει να χτίσει πυρηνικό σταθμό στη Σελήνη πριν το 2036!» Health

«Σοκαριστικές αποκαλύψεις: Η Ρωσία σκοπεύει να χτίσει πυρηνικό σταθμό στη Σελήνη πριν το 2036!»

Marizas Dimitris24 Δεκεμβρίου 2025
Το GPT-5.2 ξεπερνά τη βασική γραμμή του ειδικού διδακτορικού με 92% βαθμολογία επιστήμης Technology

Το GPT-5.2 ξεπερνά τη βασική γραμμή του ειδικού διδακτορικού με 92% βαθμολογία επιστήμης

Marizas Dimitris24 Δεκεμβρίου 2025
iOS 26.3: Η Επαναστατική Μέθοδος για Ανεπανάληπτη Μεταφορά Στοιχείων από iPhone σε Android! Technology

Ανακαλύψτε το iOS 26.3: Εντυπωσιακή Third-Party Proximity Pairing Έρχεται στην Ευρώπη!

Marizas Dimitris24 Δεκεμβρίου 2025
Most Popular

Οδηγός για το Πρόγραμμα «Ψηφιακές Συναλλαγές Β’» (2025) – Όσα πρέπει να γνωρίζουμε

13 Νοεμβρίου 20251.156 Views

Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

30 Οκτωβρίου 2025570 Views
Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα οδηγός

Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους

12 Νοεμβρίου 2025468 Views
About TechReport.gr

Το TechReport.gr ιδρύθηκε με στόχο να αποτελέσει την πρώτη πηγή ενημέρωσης για όσους αναζητούν αξιόπιστη και εμπεριστατωμένη κάλυψη του τεχνολογικού κόσμου. Από την αρχή της λειτουργίας του, το site έχει δεσμευτεί στην παροχή ποιοτικού περιεχομένου που συνδυάζει ενημέρωση, ανάλυση και πρακτικές συμβουλές.
• Email: [email protected]
• Phone: +30 6980 730 713
Copyright © 2025| TechReport.gr | A project by: Δημήτρης Μάριζας
Λογότυπα, επωνυμίες, εμπορικά σήματα και γνωρίσματα ανήκουν στους νόμιμους ιδιοκτήτες.

Our Picks
«Σοκαριστικές αποκαλύψεις: Η Ρωσία σκοπεύει να χτίσει πυρηνικό σταθμό στη Σελήνη πριν το 2036!»

«Σοκαριστικές αποκαλύψεις: Η Ρωσία σκοπεύει να χτίσει πυρηνικό σταθμό στη Σελήνη πριν το 2036!»

24 Δεκεμβρίου 2025
Το GPT-5.2 ξεπερνά τη βασική γραμμή του ειδικού διδακτορικού με 92% βαθμολογία επιστήμης

Το GPT-5.2 ξεπερνά τη βασική γραμμή του ειδικού διδακτορικού με 92% βαθμολογία επιστήμης

24 Δεκεμβρίου 2025
iOS 26.3: Η Επαναστατική Μέθοδος για Ανεπανάληπτη Μεταφορά Στοιχείων από iPhone σε Android!

Ανακαλύψτε το iOS 26.3: Εντυπωσιακή Third-Party Proximity Pairing Έρχεται στην Ευρώπη!

24 Δεκεμβρίου 2025
Facebook X (Twitter) Instagram Pinterest
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
© 2025 TechReport.gr Designed and Developed by Dimitris Marizas.

Type above and press Enter to search. Press Esc to cancel.

Ad Blocker Enabled!
Ad Blocker Enabled!
Our website is made possible by displaying online advertisements to our visitors. Please support us by disabling your Ad Blocker.