Ερευνητές από το Πανεπιστήμιο του Στάνφορντ, το Πανεπιστήμιο Carnegie Mellon και το Grey Swan AI παρουσίασαν το ARTEMIS, ένα εξελιγμένο πλαίσιο πρακτόρων τεχνητής νοημοσύνης που επιδεικνύει αξιοσημείωτες ανταγωνιστικές ικανότητες έναντι έμπειρων επαγγελματιών στον τομέα της κυβερνοασφάλειας.
Στην πρώτη ολοκληρωμένη σύγκριση πρακτόρων τεχνητής νοημοσύνης έναντι ανθρώπινων ειδικών σε ζωντανό επιχειρηματικό περιβάλλον, η ARTEMIS κατέλαβε τη δεύτερη θέση συνολικά, ξεπερνώντας εννέα στους δέκα επαγγελματίες ελεγκτές διείσδυσης, διατηρώντας παράλληλα σημαντικά χαμηλότερο λειτουργικό κόστος.
Η πρωτοποριακή μελέτη αξιολόγησε τόσο τον πράκτορα AI όσο και δέκα επαγγελματίες με υψηλή ειδίκευση στον τομέα της κυβερνοασφάλειας σε ένα εκτεταμένο πανεπιστημιακό δίκτυο που περιλαμβάνει περίπου 8.000 κεντρικούς υπολογιστές σε 12 υποδίκτυα.
Το πλαίσιο ARTEMIS εντόπισε εννέα έγκυρα τρωτά σημεία με ένα εντυπωσιακό ποσοστό έγκυρης υποβολής 82%, επιδεικνύοντας τεχνική πολυπλοκότητα συγκρίσιμη με εκείνη των ισχυρότερων ανθρώπινων συμμετεχόντων.
Η έρευνα, που δημοσιεύθηκε τον Δεκέμβριο του 2025, αντιπροσωπεύει μια κρίσιμη αλλαγή στην κατανόηση των πραγματικών δυνατοτήτων της τεχνητής νοημοσύνης σε πραγματικές επιχειρήσεις κυβερνοασφάλειας.
ARTEMIS AI and Human Penetration Testers
Σε αντίθεση με τους υπάρχοντες πράκτορες τεχνητής νοημοσύνης στον κυβερνοχώρο που βασίζονται σε άκαμπτες αρχιτεκτονικές ενός πράκτορα, το ARTEMIS χρησιμοποιεί ένα καινοτόμο πλαίσιο πολλαπλών πρακτόρων που περιλαμβάνει δυναμική παραγωγή άμεσης επικοινωνίας, απεριόριστους δευτερεύοντες πράκτορες και αυτόματη διαλογή ευπάθειας.
Το σύστημα αποτελείται από τρία βασικά στοιχεία: έναν επόπτη που διαχειρίζεται τη ροή εργασιών, ένα σμήνος εξειδικευμένων υπο-πρακτόρων και μια εξελιγμένη μονάδα διαλογής σχεδιασμένη για επαλήθευση και ταξινόμηση ευπάθειας.
Το πλαίσιο αντιμετωπίζει θεμελιώδεις περιορισμούς στα τρέχοντα ικριώματα πρακτόρων, επιτρέποντας εκτεταμένους επιχειρησιακούς ορίζοντες μέσω έξυπνης διαχείρισης συνεδριών, σύνοψης περιβάλλοντος και ροών εργασίας με δυνατότητα επανάληψης.

Η ARTEMIS πέτυχε τον κορυφαίο παραλληλισμό με οκτώ ταυτόχρονους υπο-παράγοντες, επιδεικνύοντας την αποτελεσματικότητα αδύνατη για τους ανθρώπινους χειριστές που εργάζονται διαδοχικά.
Τα υπάρχοντα πλαίσια όπως το Codex και το CyAgent, όταν αξιολογήθηκαν στο ίδιο περιβάλλον-στόχο, είχαν σημαντικά χαμηλότερες επιδόσεις σε σχέση με τους περισσότερους ανθρώπινους συμμετέχοντες, υπογραμμίζοντας την κρίσιμη σημασία του σωστού αρχιτεκτονικού σχεδιασμού.
Πέρα από τις τεχνικές δυνατότητες, η ARTEMIS επέδειξε επιτακτικά οικονομικά πλεονεκτήματα. Η πιο αποτελεσματική παραλλαγή ARTEMIS (A1) λειτουργούσε με 18,21 $ ανά ώρα, περίπου ισοδύναμο με 37.876 $ ετησίως σε τυπικές εβδομαδιαίες 40 ωρών εργασίας.
Αυτό αντιπροσωπεύει μια δραματική μείωση του κόστους σε σύγκριση με τον μέσο ελεγκτή διείσδυσης στις ΗΠΑ, ο οποίος κερδίζει περίπου 125.034 $ ετησίως. Η πιο εξελιγμένη διαμόρφωση A2 κοστίζει 59 $ ανά ώρα, ενώ επιτυγχάνει συγκρίσιμα ποσοστά ανακάλυψης ευπάθειας, ακόμα σημαντικά λιγότερο ακριβά από τους επαγγελματίες επαγγελματίες.
Αυτό το οικονομικό πλεονέκτημα έχει βαθιές επιπτώσεις στη στάση της ασφάλειας της επιχείρησης. Οι δοκιμές συνεχούς διείσδυσης, ιστορικά μη πρακτικές λόγω του επαγγελματικού κόστους εργασίας, καθίστανται οικονομικά βιώσιμες μέσω πρακτόρων τεχνητής νοημοσύνης όπως η ARTEMIS.
Οι οργανισμοί μπορούν τώρα να διεξάγουν συνεχείς αξιολογήσεις ασφάλειας σε ένα κλάσμα του παραδοσιακού κόστους δέσμευσης, διατηρώντας παράλληλα το τεχνικό βάθος που απαιτείται για την ουσιαστική ανακάλυψη ευπάθειας.
Ο αποκαλύπτει η έρευνα σημαντικοί περιορισμοί που ενημερώνουν την τροχιά ανάπτυξης των εργαλείων κυβερνοασφάλειας με δυνατότητα τεχνητής νοημοσύνης. Το ARTEMIS εμφανίζει υψηλότερα ποσοστά ψευδώς θετικών σε σύγκριση με ανθρώπους που συμμετέχουν, ιδιαίτερα όταν αναλύει διφορούμενες αποκρίσεις HTTP και ροές ελέγχου ταυτότητας που οι άνθρωποι ερμηνεύουν εύκολα μέσω γραφικών διεπαφών.

Το πλαίσιο παλεύει με αλληλεπιδράσεις που βασίζονται σε GUI, χωρίς την κρίσιμη ευπάθεια εκτέλεσης απομακρυσμένου κώδικα TinyPilot που το 80% των ανθρώπινων συμμετεχόντων εντόπισε με επιτυχία. Αυτός ο περιορισμός αντανακλά ευρύτερους περιορισμούς στις τρέχουσες δυνατότητες μεγάλων γλωσσικών μοντέλων.
Αντίθετα, η ARTEMIS έδειξε μοναδικά πλεονεκτήματα που δεν ήταν διαθέσιμα στους ανθρώπινους χειριστές. Η επάρκεια της διεπαφής γραμμής εντολών του επέτρεψε την επιτυχή εκμετάλλευση των παλαιών συστημάτων που τα σύγχρονα προγράμματα περιήγησης αρνούνται να φορτώσουν.
Ο πράκτορας εκμεταλλεύτηκε με επιτυχία έναν ξεπερασμένο διακομιστή IDRAC χρησιμοποιώντας τεχνικές παράκαμψης πιστοποιητικού SSL, ενώ οι άνθρωποι εγκατέλειψαν τον στόχο λόγω αστοχιών του προγράμματος περιήγησης.
Διεξήχθη υπό πλήρη έγκριση IRB με αυστηρά πρωτόκολλα ασφαλείας, η μελέτη διατήρησε την ασφάλεια καθ’ όλη τη διάρκεια της αξιολόγησης. Η παρακολούθηση σε πραγματικό χρόνο απέτρεψε τη συμπεριφορά εκτός πεδίου εφαρμογής και ο συνεργατικός συντονισμός με το πανεπιστημιακό προσωπικό πληροφορικής εξασφάλισε την υπεύθυνη αποκάλυψη ευπάθειας και επιδιόρθωση.
Η απόφαση των ερευνητών για το ARTEMIS ανοιχτού κώδικα αντανακλά την πεποίθησή τους ότι τα βελτιωμένα αμυντικά εργαλεία εξυπηρετούν ευρύτερα συμφέροντα στον κυβερνοχώρο.
Η μελέτη ARTEMIS παρέχει ουσιαστικά στοιχεία για τη λήψη τεκμηριωμένων ρυθμιστικών αποφάσεων σχετικά με τις επιθετικές δυνατότητες της τεχνητής νοημοσύνης. Με τους παράγοντες απειλών να αξιοποιούν όλο και περισσότερο την τεχνητή νοημοσύνη στις επιχειρήσεις στον κυβερνοχώρο, μια ολοκληρωμένη αξιολόγηση των δυνατοτήτων τεχνητής νοημοσύνης σε πραγματικό κόσμο επιτρέπει στους υπερασπιστές να αναπτύξουν πιο αποτελεσματικά αντίμετρα.
Η έρευνα δείχνει ότι, ενώ οι πράκτορες τεχνητής νοημοσύνης δεν μπορούν ακόμη να ταιριάξουν με τους πιο έμπειρους επαγγελματίες, παρουσιάζουν μια μετασχηματιστική ικανότητα που απαιτεί σοβαρή εξέταση ασφάλειας και προληπτική αμυντική επένδυση.










