Το νέο μοντέλο της Google σταματά το Gemini από το να γίνει αδίστακτο στο Chrome

Τι πρέπει να ξέρετε

Η Google παρουσίασε το User Alignment Critic, ένα μοντέλο που ελέγχει κάθε ενέργεια τεχνητής νοημοσύνης σε σχέση με την πρόθεσή σας πριν της επιτρέψει να εκτελεστεί.
Ο κριτικός βλέπει μόνο μεταδεδομένα, όχι περιεχόμενο ιστοσελίδων, επομένως οι εχθρικοί ιστότοποι δεν μπορούν να το ξεγελάσουν με κρυφές προτροπές.
Το Chrome περιορίζει πλέον τις αλληλεπιδράσεις του Gemini στους τομείς που συνδέονται με την εργασία σας, αποκλείοντας κάθε απροσδόκητη πρόσβαση στον ιστότοπο.

Η Google προσθέτει περισσότερα Το Gemini διαθέτει στο Chrome, επιτρέποντάς του να κάνει περισσότερα από την απλή σύνοψη σελίδων. Καθώς όμως το πρόγραμμα περιήγησης μοιάζει περισσότερο με προσωπικό βοηθό, η Google εργάζεται σκληρά για να αποτρέψει προβλήματα ασφαλείας. Εξάλλου, οι βοηθοί μπορούν να εξαπατηθούν και αυτός ο κίνδυνος βρίσκεται στο επίκεντρο των νέων αλλαγών ασφαλείας της Google.

Όταν το Gemini προσγειώθηκε για πρώτη φορά στο Chrome για χρήστες επιτραπέζιων υπολογιστών των ΗΠΑ τον Σεπτέμβριο, σηματοδότησε την αρχή της «περιήγησης με αντιπροσώπους», ο όρος της Google που επιτρέπει στην τεχνητή νοημοσύνη να κάνει ουσιαστικές ενέργειες στο διαδίκτυο. Αντί απλώς να ανταποκρίνεται σε προτροπές, το πρόγραμμα περιήγησης θα μπορούσε πραγματικά να πραγματοποιήσει μια ροή εργασίας σε σελίδες και καρτέλες.

Ωστόσο, το να επιτρέπεται στην τεχνητή νοημοσύνη να κάνει κλικ σε κουμπιά και να διαβάζει ιστότοπους για εσάς είναι ακριβώς αυτό για το οποίο έχουν προειδοποιήσει οι ειδικοί σε θέματα ασφάλειας. Ορισμένοι κακόβουλοι ιστότοποι μπορούν κρύψτε μυστικές οδηγίες στον κώδικα ή τα στοιχεία σελίδας τους, μια μέθοδο που ονομάζεται έμμεση έγχυση προτροπής, και χρησιμοποιήστε την για να ελέγξετε την τεχνητή νοημοσύνη χωρίς να το γνωρίζετε.

Για να αντιμετωπίσει αυτό, η Google είναι προσθέτοντας ένα νέο χαρακτηριστικό ασφαλείας ονομάζεται ο κριτικός ευθυγράμμισης χρήστη, ο οποίος λειτουργεί σαν ενσωματωμένος φύλακας για τις προτεινόμενες ενέργειες του Gemini. Πριν το AI εκτελέσει οτιδήποτε, η ενέργεια δρομολογείται σε αυτό το μοντέλο. Αντί να διαβάζει απευθείας την ιστοσελίδα, ο κριτικός λαμβάνει μόνο δομημένα μεταδεδομένα που περιγράφουν τι θα κάνει η ενέργεια.

(Πίστωση εικόνας: Google)

Η ενέργεια πρέπει να ταιριάζει με την πρόθεση

Η απομόνωση του κριτικού από ακατέργαστο περιεχόμενο ιστού εμποδίζει έναν εχθρικό ιστότοπο να χειραγωγήσει το ίδιο το σύστημα ασφαλείας. Εάν μια ενέργεια δεν ταιριάζει με την πρόθεσή σας που έχετε δηλώσει, ο κριτικός την αποκλείει εντελώς. Αυτό το επιπλέον επίπεδο στο Chrome βοηθά στη διατήρηση της λειτουργίας της τεχνητής νοημοσύνης όπως προβλέπεται, ακόμα κι αν ορισμένοι ιστότοποι προσπαθούν να παρέμβουν.

Αυτή η νέα αρχιτεκτονική επεκτείνει επίσης τους κανόνες απομόνωσης προέλευσης του Chrome Οι Δίδυμοι μπορούν να αλληλεπιδράσουν μόνο με τους συγκεκριμένους τομείς που εμπλέκονται στην εργασία σας. Δεν μπορεί να περιπλανηθεί σε άσχετους ιστότοπους ή να κάνει απροσδόκητα αιτήματα δικτύου.

Παράλληλα, η Google έχει επιστρώσει σε εργαλεία ανίχνευσης απειλών, επιβεβαιώσεις χρηστών για ευαίσθητες λειτουργίες και επιθετική κόκκινη ομάδα πριν από την κυκλοφορία νέων λειτουργιών αντιπροσώπων. Κάθε κομμάτι προορίζεται να ενισχύσει τα άλλα, δημιουργώντας ένα μοντέλο άμυνας σε βάθος που αντιμετωπίζει τη λήψη αποφάσεων AI ως περιβάλλον υψηλού κινδύνου και όχι ως καινοτομία.

Η Google βάζει επίσης χρήματα στο τραπέζι για να αποδείξει ότι λειτουργεί. Η εταιρεία έχει ενημερώσει το Πρόγραμμα επιβράβευσης ευπάθειας, προσφέροντας έως και 20.000 $ σε οποιονδήποτε ερευνητή μπορεί να παρακάμψει αυτά τα νέα επίπεδα ασφάλειας.

Οι αναβαθμίσεις φτάνουν καθώς το Chrome ετοιμάζεται να στείλει περισσότερες δυνατότητες αντιπροσώπων, πράγμα που σημαίνει ότι οι χρήστες σύντομα θα δουν το Gemini να αναλαμβάνει περισσότερες πρωτοβουλίες στο διαδίκτυο.

Via: androidcentral.com

What's Hot

Το νέο μοντέλο της Google σταματά το Gemini από το να γίνει αδίστακτο στο Chrome

8 Of The Best Password Managers That Users Swear By

Οι ερευνητές εκπαίδευσαν μια τεχνητή νοημοσύνη υγείας με δεδομένα Apple Watch για 3 εκατομμύρια ημέρες

8 Of The Best Password Managers That Users Swear By

Η μη συμβατική τεχνητή νοημοσύνη επιβεβαιώνει τον τεράστιο γύρο των 475 εκατομμυρίων δολαρίων

Ανακαλύψτε το Παιχνίδι που Θα Σαρώνει το 2025 – Δεν Είναι το GTA 6!

Οδηγός για το Πρόγραμμα «Ψηφιακές Συναλλαγές Β’» (2025) – Όσα πρέπει να γνωρίζουμε

Ο διαλογισμός έχει επικίνδυνες παρενέργειες. Τι λένε οι επιστήμονες;

Αλλάζω Σύστημα Θέρμανσης και Θερμοσίφωνα: Πλήρης Οδηγός για 100.000 Νέους Δικαιούχους