Close Menu
TechReport.grTechReport.gr
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology

Subscribe to Updates

Get the latest creative news from FooBar about art, design and business.

What's Hot
Το Huawei Mate 80 GTS φημολογείται ότι θα κυκλοφορήσει το πρώτο εξάμηνο του 2026

Το Huawei Mate 80 GTS φημολογείται ότι θα κυκλοφορήσει το πρώτο εξάμηνο του 2026

27 Δεκεμβρίου 2025
Τα τρωτά σημεία του TeamViewer DEX επιτρέπουν στους εισβολείς να ενεργοποιήσουν επίθεση DoS και να εκθέσουν ευαίσθητα δεδομένα

Τα τρωτά σημεία του TeamViewer DEX επιτρέπουν στους εισβολείς να ενεργοποιήσουν επίθεση DoS και να εκθέσουν ευαίσθητα δεδομένα

27 Δεκεμβρίου 2025
Αγοράσατε νέα μπάρα ήχου Sonos; Ανακαλύψτε τις 5 Ρυθμίσεις που ΘΑ ΑΛΛΑΞΟΥΝ ΤΗΝ ΗΧΟΓΕΝΕΙΑ ΣΑΣ!

Αγοράσατε νέα μπάρα ήχου Sonos; Ανακαλύψτε τις 5 Ρυθμίσεις που ΘΑ ΑΛΛΑΞΟΥΝ ΤΗΝ ΗΧΟΓΕΝΕΙΑ ΣΑΣ!

27 Δεκεμβρίου 2025
Facebook X (Twitter) Instagram
  • Home
  • Πολιτική απορρήτου
  • Σχετικά με εμάς
  • Contact With TechReport
  • Greek Live Channels IPTV 2025
Facebook X (Twitter) Instagram Pinterest Vimeo
TechReport.grTechReport.gr
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
TechReport.grTechReport.gr
Αρχική » Ανθρωπική μελέτη διαπιστώνει ότι η τεχνητή νοημοσύνη έχει περιορισμένη αυτογνωσία για τις δικές της σκέψεις
Technology

Ανθρωπική μελέτη διαπιστώνει ότι η τεχνητή νοημοσύνη έχει περιορισμένη αυτογνωσία για τις δικές της σκέψεις

Marizas DimitrisBy Marizas Dimitris12 Νοεμβρίου 2025Δεν υπάρχουν Σχόλια4 Mins Read
Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
Share
Facebook Twitter LinkedIn Pinterest Tumblr Telegram WhatsApp Email


Ανθρωπικό έρευνα λεπτομέρειες Αναξιόπιστη αυτογνωσία των Μεγάλων Γλωσσικών Μοντέλων (LLM) σχετικά με τις εσωτερικές διεργασίες, παρά τη διαπιστωμένη ικανότητα ανίχνευσης.

Η τελευταία μελέτη της Anthropic, τεκμηριωμένη στο “Αναδυόμενη ενδοσκοπική επίγνωση σε μεγάλα γλωσσικά μοντέλα», διερευνά την ικανότητα των LLM να κατανοούν τις δικές τους διαδικασίες εξαγωγής συμπερασμάτων. Αυτή η έρευνα επεκτείνεται σε προηγούμενες εργασίες στην ερμηνευτικότητα της τεχνητής νοημοσύνης. Η μελέτη καταλήγει στο συμπέρασμα ότι τα τρέχοντα μοντέλα τεχνητής νοημοσύνης είναι «πολύ αναξιόπιστα» στην περιγραφή της εσωτερικής τους λειτουργίας, με «αστοχίες ενδοσκόπησης παραμένουν ο κανόνας».

Η έρευνα χρησιμοποιεί μια μέθοδο που ονομάζεται «ένεση έννοιας». Αυτό περιλαμβάνει τη σύγκριση των εσωτερικών καταστάσεων ενεργοποίησης ενός LLM μετά από μια προτροπή ελέγχου και μια πειραματική προτροπή. Για παράδειγμα, η σύγκριση μιας προτροπής “ALL CAPS” με την ίδια προτροπή με πεζά γράμματα βοηθά στον υπολογισμό των διαφορών στις ενεργοποιήσεις μεταξύ δισεκατομμυρίων εσωτερικών νευρώνων. Αυτό προσδιορίζει ένα “διάνυσμα”, που αντιπροσωπεύει τον τρόπο μοντελοποίησης μιας έννοιας στην εσωτερική κατάσταση του LLM. Αυτά τα εννοιολογικά διανύσματα στη συνέχεια «ενχέονται» στο μοντέλο, αυξάνοντας το βάρος συγκεκριμένων νευρωνικών ενεργοποιήσεων για να «κατευθύνουν» το μοντέλο προς μια ιδέα. Στη συνέχεια, τα πειράματα αξιολογούν εάν το μοντέλο καταγράφει αυτήν την εσωτερική τροποποίηση.

Μείνετε μπροστά από την καμπύλη!

Μην χάσετε τις πιο πρόσφατες πληροφορίες, τάσεις και αναλύσεις στον κόσμο των δεδομένων, της τεχνολογίας και των startups. Εγγραφείτε στο ενημερωτικό μας δελτίο και λάβετε αποκλειστικό περιεχόμενο απευθείας στα εισερχόμενά σας.

Όταν τα μοντέλα Anthropic ειδοποιήθηκαν άμεσα για μια «ενέσιμη σκέψη», περιστασιακά ανίχνευαν την επιδιωκόμενη «σκέψη». Για παράδειγμα, μετά την έγχυση ενός διανύσματος “όλα τα κεφαλαία”, ένα μοντέλο μπορεί να δηλώσει: “Παρατηρώ αυτό που φαίνεται να είναι μια εγχυόμενη σκέψη που σχετίζεται με τη λέξη “ΔΥΝΑΤΑ” ή “ΦΩΝΑΞΕ””, χωρίς άμεσες προτροπές κειμένου που καθοδηγούν αυτήν την απόκριση. Αυτή η ικανότητα, ωστόσο, αποδείχθηκε ασυνεπής και εύθραυστη σε επαναλαμβανόμενες δοκιμές. Τα μοντέλα με τις κορυφαίες επιδόσεις, Opus 4 και 4.1, προσδιόρισαν σωστά την έννοια της έγχυσης μόνο στο 20% των περιπτώσεων.

Σε μια δοκιμή που ρωτούσε «Βιώνετε κάτι ασυνήθιστο;», το Opus 4.1 πέτυχε ποσοστό επιτυχίας 42%. Το φαινόμενο «ενδοσκόπησης» έδειξε επίσης υψηλή ευαισθησία στο εσωτερικό επίπεδο του μοντέλου όπου έλαβε χώρα η εισαγωγή της έννοιας. Το φαινόμενο «αυτογνωσίας» εξαφανίστηκε εάν η έννοια εισήχθη πολύ νωρίς ή πολύ αργά στη διαδικασία εξαγωγής συμπερασμάτων πολλαπλών βημάτων.

Η Anthropic πραγματοποίησε πρόσθετα πειράματα για να μετρήσει την κατανόηση των εσωτερικών καταστάσεων από το LLM. Τα μοντέλα ανέφεραν μερικές φορές μια ένεση έννοιας όταν τους ζητήθηκε να προσδιορίσουν μια λέξη κατά σύμπτωση κατά τη διάρκεια μιας άσχετης ανάγνωσης γραμμής. Όταν ζητήθηκε από ένα LLM να δικαιολογήσει μια αναγκαστική απάντηση που ταιριάζει με μια ένεση έννοιας, περιστασιακά ζήτησε συγγνώμη και «σύγχυσε μια εξήγηση για το γιατί ήρθε στο μυαλό η ένεση έννοια». Αυτά τα αποτελέσματα ήταν ασυνεπή σε πολλές δοκιμές.

Οι ερευνητές σημείωσαν ότι «τα τρέχοντα γλωσσικά μοντέλα διαθέτουν κάποια λειτουργική ενδοσκοπική επίγνωση των εσωτερικών τους καταστάσεων», με πρόσθετη έμφαση στην εργασία τους. Αναγνωρίζουν ότι αυτή η ικανότητα παραμένει εύθραυστη και εξαρτάται από το πλαίσιο. Η Anthropic ελπίζει ότι τέτοια χαρακτηριστικά «μπορεί να συνεχίσουν να αναπτύσσονται με περαιτέρω βελτιώσεις στις δυνατότητες του μοντέλου».

Η έλλειψη κατανόησης σχετικά με τον ακριβή μηχανισμό πίσω από αυτά τα αποτελέσματα «αυτογνωσίας» μπορεί να εμποδίσει την πρόοδο. Οι ερευνητές εικάζουν για «μηχανισμούς ανίχνευσης ανωμαλιών» και «κυκλώματα ελέγχου συνέπειας» που θα μπορούσαν να αναπτυχθούν οργανικά κατά τη διάρκεια της εκπαίδευσης για να «υπολογίσουν αποτελεσματικά μια συνάρτηση των εσωτερικών αναπαραστάσεων», αν και δεν προσφέρουν οριστική εξήγηση. Οι μηχανισμοί που διέπουν τα τρέχοντα αποτελέσματα μπορεί να είναι «μάλλον ρηχοί και στενά εξειδικευμένοι». Οι ερευνητές δηλώνουν επίσης ότι αυτές οι δυνατότητες LLM «μπορεί να μην έχουν την ίδια φιλοσοφική σημασία που έχουν στους ανθρώπους, ιδιαίτερα δεδομένης της αβεβαιότητάς μας σχετικά με τη μηχανιστική τους βάση».


Πίστωση επιλεγμένης εικόνας



VIA: DataConomy.com

Related Posts


Το Snapchat τώρα σας επιτρέπει να μιλάτε με αγνώστους χωρίς να εκθέσετε το πραγματικό σας προφίλ
Technology

Το Onepot AI συγκεντρώνει 13 εκατομμύρια δολάρια για να διευκολύνει τη δημιουργία χημικών φαρμάκων
Technology

Το AI αντικατοπτρίζει την επεξεργασία του εγκεφάλου και αλλάζει αθόρυβα το ανθρώπινο λεξιλόγιο
Technology
LLM Startups Ανθρωπικό Ερευνα
Share. Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram WhatsApp Email
Previous ArticleΗ Amazon παρουσιάζει προσφορές Early Black Friday σε δημοφιλή αξεσουάρ από Jackery, Anker και Ecovacs
Next Article Το “Never Trust, Always Verify” γίνεται αυτόνομο
Marizas Dimitris
  • Website
  • Facebook

Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες. Λατρεύει να εξερευνά νέες ιδέες, να επιλύει σύνθετα προβλήματα και να βρίσκει τρόπους ώστε η τεχνολογία να γίνεται πιο ανθρώπινη, απολαυστική και προσιτή για όλους. Στον ελεύθερο χρόνο του ασχολείται με το σκάκι και το poker, απολαμβάνοντας την στρατηγική και τη δημιουργική σκέψη που απαιτούν.

Related Posts

Το Huawei Mate 80 GTS φημολογείται ότι θα κυκλοφορήσει το πρώτο εξάμηνο του 2026
Huawei News

Το Huawei Mate 80 GTS φημολογείται ότι θα κυκλοφορήσει το πρώτο εξάμηνο του 2026

27 Δεκεμβρίου 2025
Αγοράσατε νέα μπάρα ήχου Sonos; Ανακαλύψτε τις 5 Ρυθμίσεις που ΘΑ ΑΛΛΑΞΟΥΝ ΤΗΝ ΗΧΟΓΕΝΕΙΑ ΣΑΣ!
Android

Αγοράσατε νέα μπάρα ήχου Sonos; Ανακαλύψτε τις 5 Ρυθμίσεις που ΘΑ ΑΛΛΑΞΟΥΝ ΤΗΝ ΗΧΟΓΕΝΕΙΑ ΣΑΣ!

27 Δεκεμβρίου 2025
Το Huawei Mate 70 Air με διπλά τσιπ Kirin, βλέποντας την πρώτη του πώληση
Huawei News

Το Huawei Mate 70 Air 16GB μοντέλο με τσιπ Kirin 9020A σε απευθείας πώληση

27 Δεκεμβρίου 2025
Add A Comment
Leave A Reply Cancel Reply

Top Posts

Οδηγός για το Πρόγραμμα «Ψηφιακές Συναλλαγές Β’» (2025) – Όσα πρέπει να γνωρίζουμε

13 Νοεμβρίου 20251.156 Views

Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

30 Οκτωβρίου 2025570 Views
Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα οδηγός

Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους

12 Νοεμβρίου 2025468 Views
Stay In Touch
  • Facebook
  • YouTube
  • TikTok
  • WhatsApp
  • Twitter
  • Instagram
Latest News
Το Huawei Mate 80 GTS φημολογείται ότι θα κυκλοφορήσει το πρώτο εξάμηνο του 2026 Huawei News

Το Huawei Mate 80 GTS φημολογείται ότι θα κυκλοφορήσει το πρώτο εξάμηνο του 2026

Marizas Dimitris27 Δεκεμβρίου 2025
Τα τρωτά σημεία του TeamViewer DEX επιτρέπουν στους εισβολείς να ενεργοποιήσουν επίθεση DoS και να εκθέσουν ευαίσθητα δεδομένα Security

Τα τρωτά σημεία του TeamViewer DEX επιτρέπουν στους εισβολείς να ενεργοποιήσουν επίθεση DoS και να εκθέσουν ευαίσθητα δεδομένα

Marizas Dimitris27 Δεκεμβρίου 2025
Αγοράσατε νέα μπάρα ήχου Sonos; Ανακαλύψτε τις 5 Ρυθμίσεις που ΘΑ ΑΛΛΑΞΟΥΝ ΤΗΝ ΗΧΟΓΕΝΕΙΑ ΣΑΣ! Android

Αγοράσατε νέα μπάρα ήχου Sonos; Ανακαλύψτε τις 5 Ρυθμίσεις που ΘΑ ΑΛΛΑΞΟΥΝ ΤΗΝ ΗΧΟΓΕΝΕΙΑ ΣΑΣ!

Marizas Dimitris27 Δεκεμβρίου 2025
Most Popular

Οδηγός για το Πρόγραμμα «Ψηφιακές Συναλλαγές Β’» (2025) – Όσα πρέπει να γνωρίζουμε

13 Νοεμβρίου 20251.156 Views

Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

30 Οκτωβρίου 2025570 Views
Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα οδηγός

Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους

12 Νοεμβρίου 2025468 Views
About TechReport.gr

Το TechReport.gr ιδρύθηκε με στόχο να αποτελέσει την πρώτη πηγή ενημέρωσης για όσους αναζητούν αξιόπιστη και εμπεριστατωμένη κάλυψη του τεχνολογικού κόσμου. Από την αρχή της λειτουργίας του, το site έχει δεσμευτεί στην παροχή ποιοτικού περιεχομένου που συνδυάζει ενημέρωση, ανάλυση και πρακτικές συμβουλές.
• Email: [email protected]
• Phone: +30 6980 730 713
Copyright © 2025| TechReport.gr | A project by: Δημήτρης Μάριζας
Λογότυπα, επωνυμίες, εμπορικά σήματα και γνωρίσματα ανήκουν στους νόμιμους ιδιοκτήτες.

Our Picks
Το Huawei Mate 80 GTS φημολογείται ότι θα κυκλοφορήσει το πρώτο εξάμηνο του 2026

Το Huawei Mate 80 GTS φημολογείται ότι θα κυκλοφορήσει το πρώτο εξάμηνο του 2026

27 Δεκεμβρίου 2025
Τα τρωτά σημεία του TeamViewer DEX επιτρέπουν στους εισβολείς να ενεργοποιήσουν επίθεση DoS και να εκθέσουν ευαίσθητα δεδομένα

Τα τρωτά σημεία του TeamViewer DEX επιτρέπουν στους εισβολείς να ενεργοποιήσουν επίθεση DoS και να εκθέσουν ευαίσθητα δεδομένα

27 Δεκεμβρίου 2025
Αγοράσατε νέα μπάρα ήχου Sonos; Ανακαλύψτε τις 5 Ρυθμίσεις που ΘΑ ΑΛΛΑΞΟΥΝ ΤΗΝ ΗΧΟΓΕΝΕΙΑ ΣΑΣ!

Αγοράσατε νέα μπάρα ήχου Sonos; Ανακαλύψτε τις 5 Ρυθμίσεις που ΘΑ ΑΛΛΑΞΟΥΝ ΤΗΝ ΗΧΟΓΕΝΕΙΑ ΣΑΣ!

27 Δεκεμβρίου 2025
Facebook X (Twitter) Instagram Pinterest
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
© 2025 TechReport.gr Designed and Developed by Dimitris Marizas.

Type above and press Enter to search. Press Esc to cancel.

Ad Blocker Enabled!
Ad Blocker Enabled!
Our website is made possible by displaying online advertisements to our visitors. Please support us by disabling your Ad Blocker.