Τι πρέπει να ξέρετε
- Η Google παρουσίασε το User Alignment Critic, ένα μοντέλο που ελέγχει κάθε ενέργεια τεχνητής νοημοσύνης σε σχέση με την πρόθεσή σας πριν της επιτρέψει να εκτελεστεί.
- Ο κριτικός βλέπει μόνο μεταδεδομένα, όχι περιεχόμενο ιστοσελίδων, επομένως οι εχθρικοί ιστότοποι δεν μπορούν να το ξεγελάσουν με κρυφές προτροπές.
- Το Chrome περιορίζει πλέον τις αλληλεπιδράσεις του Gemini στους τομείς που συνδέονται με την εργασία σας, αποκλείοντας κάθε απροσδόκητη πρόσβαση στον ιστότοπο.
Όταν το Gemini προσγειώθηκε για πρώτη φορά στο Chrome για χρήστες επιτραπέζιων υπολογιστών των ΗΠΑ τον Σεπτέμβριο, σηματοδότησε την αρχή της «περιήγησης με αντιπροσώπους», ο όρος της Google που επιτρέπει στην τεχνητή νοημοσύνη να κάνει ουσιαστικές ενέργειες στο διαδίκτυο. Αντί απλώς να ανταποκρίνεται σε προτροπές, το πρόγραμμα περιήγησης θα μπορούσε πραγματικά να πραγματοποιήσει μια ροή εργασίας σε σελίδες και καρτέλες.
Ωστόσο, το να επιτρέπεται στην τεχνητή νοημοσύνη να κάνει κλικ σε κουμπιά και να διαβάζει ιστότοπους για εσάς είναι ακριβώς αυτό για το οποίο έχουν προειδοποιήσει οι ειδικοί σε θέματα ασφάλειας. Ορισμένοι κακόβουλοι ιστότοποι μπορούν κρύψτε μυστικές οδηγίες στον κώδικα ή τα στοιχεία σελίδας τους, μια μέθοδο που ονομάζεται έμμεση έγχυση προτροπής, και χρησιμοποιήστε την για να ελέγξετε την τεχνητή νοημοσύνη χωρίς να το γνωρίζετε.
Για να αντιμετωπίσει αυτό, η Google είναι προσθέτοντας ένα νέο χαρακτηριστικό ασφαλείας ονομάζεται ο κριτικός ευθυγράμμισης χρήστη, ο οποίος λειτουργεί σαν ενσωματωμένος φύλακας για τις προτεινόμενες ενέργειες του Gemini. Πριν το AI εκτελέσει οτιδήποτε, η ενέργεια δρομολογείται σε αυτό το μοντέλο. Αντί να διαβάζει απευθείας την ιστοσελίδα, ο κριτικός λαμβάνει μόνο δομημένα μεταδεδομένα που περιγράφουν τι θα κάνει η ενέργεια.
Η ενέργεια πρέπει να ταιριάζει με την πρόθεση
Η απομόνωση του κριτικού από ακατέργαστο περιεχόμενο ιστού εμποδίζει έναν εχθρικό ιστότοπο να χειραγωγήσει το ίδιο το σύστημα ασφαλείας. Εάν μια ενέργεια δεν ταιριάζει με την πρόθεσή σας που έχετε δηλώσει, ο κριτικός την αποκλείει εντελώς. Αυτό το επιπλέον επίπεδο στο Chrome βοηθά στη διατήρηση της λειτουργίας της τεχνητής νοημοσύνης όπως προβλέπεται, ακόμα κι αν ορισμένοι ιστότοποι προσπαθούν να παρέμβουν.
Αυτή η νέα αρχιτεκτονική επεκτείνει επίσης τους κανόνες απομόνωσης προέλευσης του Chrome Οι Δίδυμοι μπορούν να αλληλεπιδράσουν μόνο με τους συγκεκριμένους τομείς που εμπλέκονται στην εργασία σας. Δεν μπορεί να περιπλανηθεί σε άσχετους ιστότοπους ή να κάνει απροσδόκητα αιτήματα δικτύου.
Παράλληλα, η Google έχει επιστρώσει σε εργαλεία ανίχνευσης απειλών, επιβεβαιώσεις χρηστών για ευαίσθητες λειτουργίες και επιθετική κόκκινη ομάδα πριν από την κυκλοφορία νέων λειτουργιών αντιπροσώπων. Κάθε κομμάτι προορίζεται να ενισχύσει τα άλλα, δημιουργώντας ένα μοντέλο άμυνας σε βάθος που αντιμετωπίζει τη λήψη αποφάσεων AI ως περιβάλλον υψηλού κινδύνου και όχι ως καινοτομία.
Η Google βάζει επίσης χρήματα στο τραπέζι για να αποδείξει ότι λειτουργεί. Η εταιρεία έχει ενημερώσει το Πρόγραμμα επιβράβευσης ευπάθειας, προσφέροντας έως και 20.000 $ σε οποιονδήποτε ερευνητή μπορεί να παρακάμψει αυτά τα νέα επίπεδα ασφάλειας.
Οι αναβαθμίσεις φτάνουν καθώς το Chrome ετοιμάζεται να στείλει περισσότερες δυνατότητες αντιπροσώπων, πράγμα που σημαίνει ότι οι χρήστες σύντομα θα δουν το Gemini να αναλαμβάνει περισσότερες πρωτοβουλίες στο διαδίκτυο.
Via: androidcentral.com










