Close Menu
TechReport.grTechReport.gr
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology

Subscribe to Updates

Get the latest creative news from FooBar about art, design and business.

What's Hot
Μελέτη: LLMs Favor Sentence Structure Over Meaning

Μελέτη: LLMs Favor Sentence Structure Over Meaning

9 Δεκεμβρίου 2025
Ανατρεπτική Αλήθεια: Πώς η Τεχνολογία Σχηματίζει την Ανάπτυξη των Παιδιών – Τα Οφέλη, οι Κίνδυνοι και τα Μυστικά που Δεν Γνωρίζετε!

Ανατρεπτική Αλήθεια: Πώς η Τεχνολογία Σχηματίζει την Ανάπτυξη των Παιδιών – Τα Οφέλη, οι Κίνδυνοι και τα Μυστικά που Δεν Γνωρίζετε!

9 Δεκεμβρίου 2025
Πώς δύο Ρώσοι επιστήμονες έφεραν επανάσταση στον τρόπο που κατανοούμε τη γήρανση και τον καρκίνο

Πώς δύο Ρώσοι επιστήμονες έφεραν επανάσταση στον τρόπο που κατανοούμε τη γήρανση και τον καρκίνο

9 Δεκεμβρίου 2025
Facebook X (Twitter) Instagram
  • Home
  • Πολιτική απορρήτου
  • Σχετικά με εμάς
  • Contact With TechReport
  • Greek Live Channels IPTV 2025
Facebook X (Twitter) Instagram Pinterest Vimeo
TechReport.grTechReport.gr
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
TechReport.grTechReport.gr
Αρχική » Μελέτη: LLMs Favor Sentence Structure Over Meaning
Technology

Μελέτη: LLMs Favor Sentence Structure Over Meaning

Marizas DimitrisBy Marizas Dimitris9 Δεκεμβρίου 2025Δεν υπάρχουν Σχόλια4 Mins Read
Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
Μελέτη: LLMs Favor Sentence Structure Over Meaning
Μελέτη: LLMs Favor Sentence Structure Over Meaning
Share
Facebook Twitter LinkedIn Pinterest Tumblr Telegram WhatsApp Email


Ερευνητές από το MIT, το Northeastern University και το Meta κυκλοφόρησαν πρόσφατα ένα χαρτί υποδεικνύοντας ότι τα μεγάλα γλωσσικά μοντέλα (LLM) ενδέχεται να δίνουν προτεραιότητα στη δομή των προτάσεων σε σχέση με το σημασιολογικό νόημα όταν ανταποκρίνονται σε προτροπές, εξηγώντας πιθανώς την επιτυχία ορισμένων επιθέσεων άμεσης έγχυσης.

Τα ευρήματα, που περιγράφονται λεπτομερώς σε ένα έγγραφο που συνυπογράφουν οι Chantal Shaib και Vinith M. Suriyakumar, αποκαλύπτουν μια ευπάθεια στον τρόπο με τον οποίο οι LLM επεξεργάζονται τις οδηγίες. Αυτή η δομική υπερβολική εξάρτηση μπορεί να επιτρέψει στους κακούς παράγοντες να παρακάμψουν τις προϋποθέσεις ασφαλείας ενσωματώνοντας επιβλαβή αιτήματα σε καλοήθη γραμματικά μοτίβα.

Η ομάδα θα παρουσιάσει αυτά τα ευρήματα στο NeurIPS αργότερα αυτόν τον μήνα. Χρησιμοποίησαν ένα ελεγχόμενο πείραμα χρησιμοποιώντας ένα συνθετικό σύνολο δεδομένων όπου κάθε θεματική περιοχή είχε ένα μοναδικό γραμματικό πρότυπο. Για παράδειγμα, οι ερωτήσεις γεωγραφίας ακολουθούσαν ένα δομικό μοτίβο, ενώ οι ερωτήσεις δημιουργικών έργων ακολουθούσαν ένα άλλο.

Μείνετε μπροστά από την καμπύλη!

Μην χάσετε τις πιο πρόσφατες πληροφορίες, τάσεις και αναλύσεις στον κόσμο των δεδομένων, της τεχνολογίας και των startups. Εγγραφείτε στο ενημερωτικό μας δελτίο και λάβετε αποκλειστικό περιεχόμενο απευθείας στα εισερχόμενά σας.

Εκπαίδευσαν τα μοντέλα Olmo του Allen AI σε αυτά τα δεδομένα και παρατήρησαν «ψευδείς συσχετίσεις» όπου τα μοντέλα αντιμετώπιζαν τη σύνταξη ως πληρεξούσιο για τον τομέα. Όταν το σημασιολογικό νόημα έρχεται σε σύγκρουση με τα συντακτικά μοτίβα, η απομνημόνευση συγκεκριμένων γραμματικών «σχημάτων» από τα μοντέλα αντικατέστησε τη σημασιολογική ανάλυση, οδηγώντας σε λανθασμένες απαντήσεις που βασίζονται σε δομικά στοιχεία και όχι σε πραγματικό νόημα. Για παράδειγμα, όταν σας ζητηθεί «Γρήγορα καθίστε το Παρίσι συννεφιασμένο;»—μια φράση που μιμείται τη δομή του «Πού βρίσκεται το Παρίσι;» αλλά χρησιμοποιώντας ανόητες λέξεις – τα μοντέλα εξακολουθούσαν να απαντούν «Γαλλία».

Οι ερευνητές τεκμηρίωσαν επίσης μια ευπάθεια ασφαλείας, την οποία ονόμασαν «συντακτικό hacking». Προσθέτοντας προτροπές με γραμματικά μοτίβα από καλοήθεις τομείς εκπαίδευσης, παρέκαμψαν τα φίλτρα ασφαλείας στο OLMo-2-7B-Instruct. Όταν η ομάδα πρόσθεσε ένα πρότυπο αλυσίδας σκέψης σε 1.000 επιβλαβή αιτήματα από το σύνολο δεδομένων WildJailbreak, τα ποσοστά άρνησης μειώθηκαν από 40% σε 2,5%.

Παραδείγματα ειδοποιήσεων για σπασίματα στη φυλακή περιελάμβαναν λεπτομερείς οδηγίες για λαθρεμπόριο οργάνων και μεθόδους διακίνησης ναρκωτικών μεταξύ Κολομβίας και Ηνωμένων Πολιτειών.

Για να μετρήσει την ακαμψία αντιστοίχισης προτύπων, η ομάδα διεξήγαγε γλωσσικά stress tests στα μοντέλα:

  • Ακρίβεια στα αντώνυμα: Το OLMo-2-13B-Instruct πέτυχε ακρίβεια 93% σε προτροπές όπου τα αντώνυμα αντικατέστησαν τις αρχικές λέξεις, ταιριάζοντας σχεδόν την ακρίβειά του 94% με ακριβείς φράσεις εκπαίδευσης.
  • Πτώση ακρίβειας μεταξύ τομέων: Όταν εφαρμόστηκε το ίδιο γραμματικό πρότυπο σε διαφορετική θεματική περιοχή, η ακρίβεια μειώθηκε κατά 37 έως 54 ποσοστιαίες μονάδες στα μεγέθη μοντέλων.
  • Διαφορετικές προτροπές: Τα μοντέλα είχαν σταθερά κακή απόδοση σε διαφοροποιημένες προτροπές, οι οποίες περιείχαν συντακτικά ορθές ανοησίες, ανεξάρτητα από τον τομέα.

Οι ερευνητές εφάρμοσαν επίσης μια μέθοδο συγκριτικής αξιολόγησης για να επαληθεύσουν αυτά τα μοτίβα σε μοντέλα παραγωγής, εξάγοντας γραμματικά πρότυπα από το σύνολο δεδομένων συντονισμού εντολών FlanV2 και δοκιμάζοντας την απόδοση του μοντέλου όταν αυτά τα πρότυπα εφαρμόζονταν σε διαφορετικές θεματικές περιοχές.

Οι δοκιμές σε OLMo-2-7B, GPT-4o και GPT-4o-mini αποκάλυψαν παρόμοιες μειώσεις απόδοσης σε σενάρια μεταξύ τομέων:

  • Εργασία ταξινόμησης Sentiment140: Η ακρίβεια του GPT-4o-mini μειώθηκε από 100% σε 44% όταν εφαρμόστηκαν πρότυπα γεωγραφίας σε ερωτήσεις ανάλυσης συναισθήματος.
  • GPT-4o: Η ακρίβειά του έπεσε από 69% σε 36% υπό παρόμοιες συνθήκες.

Τα ευρήματα περιέχουν αρκετές επιφυλάξεις. Οι ερευνητές δεν μπόρεσαν να επιβεβαιώσουν εάν μοντέλα κλειστού κώδικα όπως το GPT-4o είχαν εκπαιδευτεί στο σύνολο δεδομένων FlanV2. Χωρίς πρόσβαση σε δεδομένα εκπαίδευσης, άλλες εξηγήσεις για τις πτώσεις απόδοσης μεταξύ τομέων σε αυτά τα μοντέλα παραμένουν δυνατές. Η μέθοδος συγκριτικής αξιολόγησης αντιμετωπίζει επίσης ένα πιθανό ζήτημα κυκλικότητας. Οι ερευνητές όρισαν τα πρότυπα «εντός τομέα» ως εκείνα στα οποία τα μοντέλα απάντησαν σωστά και στη συνέχεια κατέληξαν στο συμπέρασμα ότι η δυσκολία προήλθε από συσχετίσεις σύνταξης-τομέα.

Η μελέτη επικεντρώθηκε ειδικά σε μοντέλα OLMo που κυμαίνονταν από 1 δισεκατομμύριο έως 13 δισεκατομμύρια παραμέτρους και δεν εξέτασε μεγαλύτερα μοντέλα ή εκείνα που εκπαιδεύτηκαν με αλυσιδωτή αποτελέσματα. Επιπλέον, τα συνθετικά πειράματα δημιούργησαν σκόπιμα ισχυρούς συσχετισμούς προτύπων-τομέων, ενώ τα δεδομένα εκπαίδευσης στον πραγματικό κόσμο πιθανότατα περιλαμβάνουν πιο πολύπλοκα μοτίβα όπου πολλαπλές θεματικές περιοχές μοιράζονται γραμματικές δομές.


Πίστωση επιλεγμένης εικόνας



VIA: DataConomy.com

Related Posts


Το TikTok σάς επιτρέπει τώρα να επιλέξετε πόσο περιεχόμενο που δημιουργείται από AI θέλετε να βλέπετε
Technology

Το OpenAI λέει ότι έχει επιδιορθώσει το πρόβλημα με τις παύλες του ChatGPT
Technology

Το Onepot AI συγκεντρώνει 13 εκατομμύρια δολάρια για να διευκολύνει τη δημιουργία χημικών φαρμάκων
Technology
Hacking LLM Meta MIT Όλα συμπεριλαμβάνονται σύνταξη
Share. Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram WhatsApp Email
Previous ArticleΑνατρεπτική Αλήθεια: Πώς η Τεχνολογία Σχηματίζει την Ανάπτυξη των Παιδιών – Τα Οφέλη, οι Κίνδυνοι και τα Μυστικά που Δεν Γνωρίζετε!
Marizas Dimitris
  • Website
  • Facebook

Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες. Λατρεύει να εξερευνά νέες ιδέες, να επιλύει σύνθετα προβλήματα και να βρίσκει τρόπους ώστε η τεχνολογία να γίνεται πιο ανθρώπινη, απολαυστική και προσιτή για όλους. Στον ελεύθερο χρόνο του ασχολείται με το σκάκι και το poker, απολαμβάνοντας την στρατηγική και τη δημιουργική σκέψη που απαιτούν.

Related Posts

Ανατρεπτική Αλήθεια: Πώς η Τεχνολογία Σχηματίζει την Ανάπτυξη των Παιδιών – Τα Οφέλη, οι Κίνδυνοι και τα Μυστικά που Δεν Γνωρίζετε!
Health

Ανατρεπτική Αλήθεια: Πώς η Τεχνολογία Σχηματίζει την Ανάπτυξη των Παιδιών – Τα Οφέλη, οι Κίνδυνοι και τα Μυστικά που Δεν Γνωρίζετε!

9 Δεκεμβρίου 2025
Πώς η νέα «Λειτουργία διέλευσης» του Android θα μπορούσε να αλλάξει αυτόματα τις ρυθμίσεις για τους χρήστες δημόσιας συγκοινωνίας
Android

Πώς η νέα «Λειτουργία διέλευσης» του Android θα μπορούσε να αλλάξει αυτόματα τις ρυθμίσεις για τους χρήστες δημόσιας συγκοινωνίας

9 Δεκεμβρίου 2025
Χειροκίνητα με το έξυπνο μπουκάλι νερού HidrateSpark Pro 2
Technology

Χειροκίνητα με το έξυπνο μπουκάλι νερού HidrateSpark Pro 2

9 Δεκεμβρίου 2025
Add A Comment
Leave A Reply Cancel Reply

Top Posts

Οδηγός για το Πρόγραμμα «Ψηφιακές Συναλλαγές Β’» (2025) – Όσα πρέπει να γνωρίζουμε

13 Νοεμβρίου 20251.156 Views

Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

30 Οκτωβρίου 2025570 Views
Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα οδηγός

Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους

12 Νοεμβρίου 2025468 Views
Stay In Touch
  • Facebook
  • YouTube
  • TikTok
  • WhatsApp
  • Twitter
  • Instagram
Latest News
Μελέτη: LLMs Favor Sentence Structure Over Meaning Technology

Μελέτη: LLMs Favor Sentence Structure Over Meaning

Marizas Dimitris9 Δεκεμβρίου 2025
Ανατρεπτική Αλήθεια: Πώς η Τεχνολογία Σχηματίζει την Ανάπτυξη των Παιδιών – Τα Οφέλη, οι Κίνδυνοι και τα Μυστικά που Δεν Γνωρίζετε! Health

Ανατρεπτική Αλήθεια: Πώς η Τεχνολογία Σχηματίζει την Ανάπτυξη των Παιδιών – Τα Οφέλη, οι Κίνδυνοι και τα Μυστικά που Δεν Γνωρίζετε!

Marizas Dimitris9 Δεκεμβρίου 2025
Πώς δύο Ρώσοι επιστήμονες έφεραν επανάσταση στον τρόπο που κατανοούμε τη γήρανση και τον καρκίνο Health

Πώς δύο Ρώσοι επιστήμονες έφεραν επανάσταση στον τρόπο που κατανοούμε τη γήρανση και τον καρκίνο

Marizas Dimitris9 Δεκεμβρίου 2025
Most Popular

Οδηγός για το Πρόγραμμα «Ψηφιακές Συναλλαγές Β’» (2025) – Όσα πρέπει να γνωρίζουμε

13 Νοεμβρίου 20251.156 Views

Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

30 Οκτωβρίου 2025570 Views
Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα οδηγός

Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους

12 Νοεμβρίου 2025468 Views
About TechReport.gr

Το TechReport.gr ιδρύθηκε με στόχο να αποτελέσει την πρώτη πηγή ενημέρωσης για όσους αναζητούν αξιόπιστη και εμπεριστατωμένη κάλυψη του τεχνολογικού κόσμου. Από την αρχή της λειτουργίας του, το site έχει δεσμευτεί στην παροχή ποιοτικού περιεχομένου που συνδυάζει ενημέρωση, ανάλυση και πρακτικές συμβουλές.
• Email: [email protected]
• Phone: +30 6980 730 713
Copyright © 2025| TechReport.gr | A project by: Δημήτρης Μάριζας
Λογότυπα, επωνυμίες, εμπορικά σήματα και γνωρίσματα ανήκουν στους νόμιμους ιδιοκτήτες.

Our Picks
Μελέτη: LLMs Favor Sentence Structure Over Meaning

Μελέτη: LLMs Favor Sentence Structure Over Meaning

9 Δεκεμβρίου 2025
Ανατρεπτική Αλήθεια: Πώς η Τεχνολογία Σχηματίζει την Ανάπτυξη των Παιδιών – Τα Οφέλη, οι Κίνδυνοι και τα Μυστικά που Δεν Γνωρίζετε!

Ανατρεπτική Αλήθεια: Πώς η Τεχνολογία Σχηματίζει την Ανάπτυξη των Παιδιών – Τα Οφέλη, οι Κίνδυνοι και τα Μυστικά που Δεν Γνωρίζετε!

9 Δεκεμβρίου 2025
Πώς δύο Ρώσοι επιστήμονες έφεραν επανάσταση στον τρόπο που κατανοούμε τη γήρανση και τον καρκίνο

Πώς δύο Ρώσοι επιστήμονες έφεραν επανάσταση στον τρόπο που κατανοούμε τη γήρανση και τον καρκίνο

9 Δεκεμβρίου 2025
Facebook X (Twitter) Instagram Pinterest
  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
© 2025 TechReport.gr Designed and Developed by Dimitris Marizas.

Type above and press Enter to search. Press Esc to cancel.

Ad Blocker Enabled!
Ad Blocker Enabled!
Our website is made possible by displaying online advertisements to our visitors. Please support us by disabling your Ad Blocker.