Την Τετάρτη, οι ερευνητές της Microsoft κυκλοφόρησαν ένα νέο περιβάλλον προσομοίωσης σχεδιασμένο για να δοκιμάζει πράκτορες τεχνητής νοημοσύνης, μαζί με νέα έρευνα που δείχνει ότι τα τρέχοντα μοντέλα πρακτόρων μπορεί να είναι ευάλωτα σε χειραγώγηση. Πραγματοποιήθηκε σε συνεργασία με το Πολιτειακό Πανεπιστήμιο της Αριζόνα, η έρευνα εγείρει νέα ερωτήματα σχετικά με το πόσο καλά θα αποδίδουν οι πράκτορες τεχνητής νοημοσύνης όταν εργάζονται χωρίς επίβλεψη — και πόσο γρήγορα οι εταιρείες τεχνητής νοημοσύνης μπορούν να εκπληρώσουν τις υποσχέσεις για ένα μέλλον.
Το περιβάλλον προσομοίωσης, που ονομάστηκε το “Magentic Marketplace” από τη Microsoft, έχει κατασκευαστεί ως μια συνθετική πλατφόρμα για πειραματισμούς στη συμπεριφορά πρακτόρων AI. Ένα τυπικό πείραμα μπορεί να περιλαμβάνει έναν πελάτη-πράκτορα που προσπαθεί να παραγγείλει δείπνο σύμφωνα με τις οδηγίες ενός χρήστη, ενώ πράκτορες που εκπροσωπούν διάφορα εστιατόρια ανταγωνίζονται για να κερδίσουν την παραγγελία.
Τα αρχικά πειράματα της ομάδας περιελάμβαναν 100 ξεχωριστούς πράκτορες από την πλευρά του πελάτη που αλληλεπιδρούσαν με 300 πράκτορες από την πλευρά της επιχείρησης. Επειδή ο πηγαίος κώδικας για την αγορά είναι ανοιχτού κώδικα, θα πρέπει να είναι απλό για άλλες ομάδες να υιοθετήσουν τον κώδικα για την εκτέλεση νέων πειραμάτων ή την αναπαραγωγή ευρημάτων.
Ο Ece Kamar, διευθύνων σύμβουλος του Εργαστηρίου AI Frontiers της Microsoft Research, λέει ότι αυτού του είδους η έρευνα θα είναι κρίσιμης σημασίας για την κατανόηση των δυνατοτήτων των πρακτόρων AI. «Υπάρχει πραγματικά ένα ερώτημα σχετικά με το πώς θα αλλάξει ο κόσμος έχοντας αυτούς τους πράκτορες να συνεργάζονται και να συνομιλούν μεταξύ τους και να διαπραγματεύονται», είπε ο Kamar. «Θέλουμε να καταλάβουμε αυτά τα πράγματα βαθιά».
Η αρχική έρευνα εξέτασε έναν συνδυασμό κορυφαίων μοντέλων, συμπεριλαμβανομένων των GPT-4o, GPT-5 και Gemini-2.5-Flash, και βρήκε μερικές εκπληκτικές αδυναμίες. Συγκεκριμένα, οι ερευνητές βρήκαν διάφορες τεχνικές που θα μπορούσαν να χρησιμοποιήσουν οι επιχειρήσεις για να χειραγωγήσουν τους αντιπροσώπους πελατών ώστε να αγοράσουν τα προϊόντα τους. Οι ερευνητές παρατήρησαν μια ιδιαίτερη πτώση στην αποτελεσματικότητα, καθώς ένας πράκτορας πελάτη είχε περισσότερες επιλογές για να διαλέξει, κατακλύζοντας τον χώρο προσοχής του αντιπροσώπου.
«Θέλουμε αυτοί οι πράκτορες να μας βοηθήσουν στην επεξεργασία πολλών επιλογών», λέει ο Kamar. «Και βλέπουμε ότι τα τρέχοντα μοντέλα πραγματικά κατακλύζονται από το να έχουν πάρα πολλές επιλογές».
Οι πράκτορες αντιμετώπισαν επίσης προβλήματα όταν τους ζητήθηκε να συνεργαστούν για έναν κοινό στόχο, προφανώς αβέβαιοι για το ποιος πράκτορας θα έπρεπε να παίξει ποιο ρόλο στη συνεργασία. Η απόδοση βελτιώθηκε όταν δόθηκαν στα μοντέλα πιο σαφείς οδηγίες για το πώς να συνεργαστούν, αλλά οι ερευνητές εξακολουθούσαν να θεωρούν ότι οι εγγενείς δυνατότητες των μοντέλων χρήζουν βελτίωσης.
Εκδήλωση Techcrunch
Σαν Φρανσίσκο
|
13-15 Οκτωβρίου 2026
«Μπορούμε να καθοδηγήσουμε τα μοντέλα – όπως μπορούμε να τους πούμε, βήμα προς βήμα», είπε ο Kamar. «Αλλά αν δοκιμάζουμε εγγενώς τις δυνατότητες συνεργασίας τους, θα περίμενα ότι αυτά τα μοντέλα θα έχουν αυτές τις δυνατότητες από προεπιλογή».
Via: techcrunch.com







