Close Menu
TechReport.grTechReport.gr

    Subscribe to Updates

    Get the latest creative news from FooBar about art, design and business.

    What's Hot

    Ανθρωπική μελέτη διαπιστώνει ότι η τεχνητή νοημοσύνη έχει περιορισμένη αυτογνωσία για τις δικές της σκέψεις

    12 Νοεμβρίου 2025

    Η Amazon παρουσιάζει προσφορές Early Black Friday σε δημοφιλή αξεσουάρ από Jackery, Anker και Ecovacs

    12 Νοεμβρίου 2025

    599 $ Ακόμη και το G2 αντιλαμβάνεται τα έξυπνα γυαλιά Meta AI με ευέλικτη σχεδίαση χωρίς κάμερα

    12 Νοεμβρίου 2025
    Facebook X (Twitter) Instagram
    • Home
    • Πολιτική απορρήτου
    • Σχετικά με εμάς
    • Contact With TechReport
    • Greek Live Channels IPTV 2025
    Facebook X (Twitter) Instagram Pinterest Vimeo
    TechReport.grTechReport.gr
    • Phones
      • iPhone – iOS
      • Android
      • Samsung
    • Computer
    • Internet
      • Security
    • Entertainment
      • Gaming
    • Business
    • Cryptos
    • Gadgets
    • Technology
      • Science
      • Reviews
      • How-To
    • Health
      • Psychology
    TechReport.grTechReport.gr
    Αρχική » Ανθρωπική μελέτη διαπιστώνει ότι η τεχνητή νοημοσύνη έχει περιορισμένη αυτογνωσία για τις δικές της σκέψεις
    Technology

    Ανθρωπική μελέτη διαπιστώνει ότι η τεχνητή νοημοσύνη έχει περιορισμένη αυτογνωσία για τις δικές της σκέψεις

    Marizas DimitrisBy Marizas Dimitris12 Νοεμβρίου 2025Δεν υπάρχουν Σχόλια4 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Share
    Facebook Twitter LinkedIn Pinterest Email


    Ανθρωπικό έρευνα λεπτομέρειες Αναξιόπιστη αυτογνωσία των Μεγάλων Γλωσσικών Μοντέλων (LLM) σχετικά με τις εσωτερικές διεργασίες, παρά τη διαπιστωμένη ικανότητα ανίχνευσης.

    Η τελευταία μελέτη της Anthropic, τεκμηριωμένη στο “Αναδυόμενη ενδοσκοπική επίγνωση σε μεγάλα γλωσσικά μοντέλα», διερευνά την ικανότητα των LLM να κατανοούν τις δικές τους διαδικασίες εξαγωγής συμπερασμάτων. Αυτή η έρευνα επεκτείνεται σε προηγούμενες εργασίες στην ερμηνευτικότητα της τεχνητής νοημοσύνης. Η μελέτη καταλήγει στο συμπέρασμα ότι τα τρέχοντα μοντέλα τεχνητής νοημοσύνης είναι «πολύ αναξιόπιστα» στην περιγραφή της εσωτερικής τους λειτουργίας, με «αστοχίες ενδοσκόπησης παραμένουν ο κανόνας».

    Η έρευνα χρησιμοποιεί μια μέθοδο που ονομάζεται «ένεση έννοιας». Αυτό περιλαμβάνει τη σύγκριση των εσωτερικών καταστάσεων ενεργοποίησης ενός LLM μετά από μια προτροπή ελέγχου και μια πειραματική προτροπή. Για παράδειγμα, η σύγκριση μιας προτροπής “ALL CAPS” με την ίδια προτροπή με πεζά γράμματα βοηθά στον υπολογισμό των διαφορών στις ενεργοποιήσεις μεταξύ δισεκατομμυρίων εσωτερικών νευρώνων. Αυτό προσδιορίζει ένα “διάνυσμα”, που αντιπροσωπεύει τον τρόπο μοντελοποίησης μιας έννοιας στην εσωτερική κατάσταση του LLM. Αυτά τα εννοιολογικά διανύσματα στη συνέχεια «ενχέονται» στο μοντέλο, αυξάνοντας το βάρος συγκεκριμένων νευρωνικών ενεργοποιήσεων για να «κατευθύνουν» το μοντέλο προς μια ιδέα. Στη συνέχεια, τα πειράματα αξιολογούν εάν το μοντέλο καταγράφει αυτήν την εσωτερική τροποποίηση.

    Μείνετε μπροστά από την καμπύλη!

    Μην χάσετε τις πιο πρόσφατες πληροφορίες, τάσεις και αναλύσεις στον κόσμο των δεδομένων, της τεχνολογίας και των startups. Εγγραφείτε στο ενημερωτικό μας δελτίο και λάβετε αποκλειστικό περιεχόμενο απευθείας στα εισερχόμενά σας.

    Όταν τα μοντέλα Anthropic ειδοποιήθηκαν άμεσα για μια «ενέσιμη σκέψη», περιστασιακά ανίχνευαν την επιδιωκόμενη «σκέψη». Για παράδειγμα, μετά την έγχυση ενός διανύσματος “όλα τα κεφαλαία”, ένα μοντέλο μπορεί να δηλώσει: “Παρατηρώ αυτό που φαίνεται να είναι μια εγχυόμενη σκέψη που σχετίζεται με τη λέξη “ΔΥΝΑΤΑ” ή “ΦΩΝΑΞΕ””, χωρίς άμεσες προτροπές κειμένου που καθοδηγούν αυτήν την απόκριση. Αυτή η ικανότητα, ωστόσο, αποδείχθηκε ασυνεπής και εύθραυστη σε επαναλαμβανόμενες δοκιμές. Τα μοντέλα με τις κορυφαίες επιδόσεις, Opus 4 και 4.1, προσδιόρισαν σωστά την έννοια της έγχυσης μόνο στο 20% των περιπτώσεων.

    Σε μια δοκιμή που ρωτούσε «Βιώνετε κάτι ασυνήθιστο;», το Opus 4.1 πέτυχε ποσοστό επιτυχίας 42%. Το φαινόμενο «ενδοσκόπησης» έδειξε επίσης υψηλή ευαισθησία στο εσωτερικό επίπεδο του μοντέλου όπου έλαβε χώρα η εισαγωγή της έννοιας. Το φαινόμενο «αυτογνωσίας» εξαφανίστηκε εάν η έννοια εισήχθη πολύ νωρίς ή πολύ αργά στη διαδικασία εξαγωγής συμπερασμάτων πολλαπλών βημάτων.

    Η Anthropic πραγματοποίησε πρόσθετα πειράματα για να μετρήσει την κατανόηση των εσωτερικών καταστάσεων από το LLM. Τα μοντέλα ανέφεραν μερικές φορές μια ένεση έννοιας όταν τους ζητήθηκε να προσδιορίσουν μια λέξη κατά σύμπτωση κατά τη διάρκεια μιας άσχετης ανάγνωσης γραμμής. Όταν ζητήθηκε από ένα LLM να δικαιολογήσει μια αναγκαστική απάντηση που ταιριάζει με μια ένεση έννοιας, περιστασιακά ζήτησε συγγνώμη και «σύγχυσε μια εξήγηση για το γιατί ήρθε στο μυαλό η ένεση έννοια». Αυτά τα αποτελέσματα ήταν ασυνεπή σε πολλές δοκιμές.

    Οι ερευνητές σημείωσαν ότι «τα τρέχοντα γλωσσικά μοντέλα διαθέτουν κάποια λειτουργική ενδοσκοπική επίγνωση των εσωτερικών τους καταστάσεων», με πρόσθετη έμφαση στην εργασία τους. Αναγνωρίζουν ότι αυτή η ικανότητα παραμένει εύθραυστη και εξαρτάται από το πλαίσιο. Η Anthropic ελπίζει ότι τέτοια χαρακτηριστικά «μπορεί να συνεχίσουν να αναπτύσσονται με περαιτέρω βελτιώσεις στις δυνατότητες του μοντέλου».

    Η έλλειψη κατανόησης σχετικά με τον ακριβή μηχανισμό πίσω από αυτά τα αποτελέσματα «αυτογνωσίας» μπορεί να εμποδίσει την πρόοδο. Οι ερευνητές εικάζουν για «μηχανισμούς ανίχνευσης ανωμαλιών» και «κυκλώματα ελέγχου συνέπειας» που θα μπορούσαν να αναπτυχθούν οργανικά κατά τη διάρκεια της εκπαίδευσης για να «υπολογίσουν αποτελεσματικά μια συνάρτηση των εσωτερικών αναπαραστάσεων», αν και δεν προσφέρουν οριστική εξήγηση. Οι μηχανισμοί που διέπουν τα τρέχοντα αποτελέσματα μπορεί να είναι «μάλλον ρηχοί και στενά εξειδικευμένοι». Οι ερευνητές δηλώνουν επίσης ότι αυτές οι δυνατότητες LLM «μπορεί να μην έχουν την ίδια φιλοσοφική σημασία που έχουν στους ανθρώπους, ιδιαίτερα δεδομένης της αβεβαιότητάς μας σχετικά με τη μηχανιστική τους βάση».


    Πίστωση επιλεγμένης εικόνας



    VIA: DataConomy.com

    Related Posts


    Το νέο τσιπ Broadcom θα μπορούσε να κάνει την επόμενη τηλεόρασή σας έναν άμεσο μεταφραστή
    Technology

    Το νέο Haiku 4.5 της Anthropic αντιπαλεύει το Sonnet 4 στο ένα τρίτο της τιμής
    Technology

    Το κακόβουλο λογισμικό GlassWorm επιστρέφει στο OpenVSX με 3 νέες επεκτάσεις VSCode
    Security
    LLM Startups Ανθρωπικό Ερευνα
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleΗ Amazon παρουσιάζει προσφορές Early Black Friday σε δημοφιλή αξεσουάρ από Jackery, Anker και Ecovacs
    Marizas Dimitris
    • Website
    • Facebook

    Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες της Samsung. Αγαπά να εξερευνά νέες ιδέες, να λύνει προβλήματα και να μοιράζεται τρόπους που κάνουν την τεχνολογία πιο ανθρώπινη και απολαυστική.

    Related Posts

    Technology

    599 $ Ακόμη και το G2 αντιλαμβάνεται τα έξυπνα γυαλιά Meta AI με ευέλικτη σχεδίαση χωρίς κάμερα

    12 Νοεμβρίου 2025
    Technology

    Η Airbnb δοκιμάζει μια υπηρεσία «καλτσών κουζίνας» που επιτρέπει στους επισκέπτες να κάνουν παραγγελίες Instacart πριν από τη διαμονή τους

    12 Νοεμβρίου 2025
    Technology

    Η Apple ξεκίνησε να διαθέτει τα χειριστήρια PlayStation VR2 Sense στις ΗΠΑ

    12 Νοεμβρίου 2025
    Add A Comment
    Leave A Reply Cancel Reply

    Top Posts

    Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

    30 Οκτωβρίου 2025561 Views
    Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα οδηγός

    Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους

    12 Νοεμβρίου 2025464 Views

    SpaceX Starlink V3: Νέοι Δορυφόροι με 1Tbps Bandwidth και Gigabit Ταχύτητες

    18 Οκτωβρίου 2025339 Views
    Stay In Touch
    • Facebook
    • YouTube
    • TikTok
    • WhatsApp
    • Twitter
    • Instagram
    Latest News
    Technology

    Ανθρωπική μελέτη διαπιστώνει ότι η τεχνητή νοημοσύνη έχει περιορισμένη αυτογνωσία για τις δικές της σκέψεις

    Marizas Dimitris12 Νοεμβρίου 2025
    iPhone - iOS

    Η Amazon παρουσιάζει προσφορές Early Black Friday σε δημοφιλή αξεσουάρ από Jackery, Anker και Ecovacs

    Marizas Dimitris12 Νοεμβρίου 2025
    Technology

    599 $ Ακόμη και το G2 αντιλαμβάνεται τα έξυπνα γυαλιά Meta AI με ευέλικτη σχεδίαση χωρίς κάμερα

    Marizas Dimitris12 Νοεμβρίου 2025
    Most Popular

    Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

    30 Οκτωβρίου 2025561 Views
    Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα οδηγός

    Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους

    12 Νοεμβρίου 2025464 Views

    SpaceX Starlink V3: Νέοι Δορυφόροι με 1Tbps Bandwidth και Gigabit Ταχύτητες

    18 Οκτωβρίου 2025339 Views
    About TechReport.gr

    Το TechReport.gr ιδρύθηκε με στόχο να αποτελέσει την πρώτη πηγή ενημέρωσης για όσους αναζητούν αξιόπιστη και εμπεριστατωμένη κάλυψη του τεχνολογικού κόσμου. Από την αρχή της λειτουργίας του, το site έχει δεσμευτεί στην παροχή ποιοτικού περιεχομένου που συνδυάζει ενημέρωση, ανάλυση και πρακτικές συμβουλές.
    • Email: [email protected]
    • Phone: +30 6980 730 713
    Copyright © 2025| TechReport.gr | A project by: Δημήτρης Μάριζας
    Λογότυπα, επωνυμίες, εμπορικά σήματα και γνωρίσματα ανήκουν στους νόμιμους ιδιοκτήτες.

    Our Picks

    Ανθρωπική μελέτη διαπιστώνει ότι η τεχνητή νοημοσύνη έχει περιορισμένη αυτογνωσία για τις δικές της σκέψεις

    12 Νοεμβρίου 2025

    Η Amazon παρουσιάζει προσφορές Early Black Friday σε δημοφιλή αξεσουάρ από Jackery, Anker και Ecovacs

    12 Νοεμβρίου 2025

    599 $ Ακόμη και το G2 αντιλαμβάνεται τα έξυπνα γυαλιά Meta AI με ευέλικτη σχεδίαση χωρίς κάμερα

    12 Νοεμβρίου 2025
    Facebook X (Twitter) Instagram Pinterest
    • Home
    • Technology
    • Gaming
    • Phones
    • Buy Now
    © 2025 TechBit.gr Designed and Developed by Dimitris Marizas.

    Type above and press Enter to search. Press Esc to cancel.