Google αποκαλύφθηκε Generative UI on Monday, μια τεχνολογία που επιτρέπει στα μοντέλα AI να δημιουργούν πλήρως προσαρμοσμένες διαδραστικές διεπαφές ανταποκρινόμενες στις προτροπές των χρηστών, που υποστηρίζεται από το Gemini 3 Pro και κυκλοφορεί στην εφαρμογή Gemini και στη λειτουργία AI της Αναζήτησης Google για να προσφέρει δυναμικές εμπειρίες πέρα από αποκρίσεις στατικού κειμένου.
Η βασική λειτουργικότητα του Generative UI περιλαμβάνει τη δημιουργία διαφορετικών εξόδων όπως ιστοσελίδες, διαδραστικά εργαλεία, παιχνίδια και προσομοιώσεις με βάση οποιαδήποτε ερώτηση ή οδηγία παρέχεται από τους χρήστες. Αυτή η προσέγγιση μετατοπίζεται από τις συμβατικές αλληλεπιδράσεις chatbot, οι οποίες συνήθως παράγουν μόνο κείμενο, στην παραγωγή πλήρων, διαδραστικών διεπαφών χρήστη προσαρμοσμένων σε συγκεκριμένες ανάγκες. Η διάθεση ξεκινά στην εφαρμογή Gemini, όπου οι χρήστες αντιμετωπίζουν απευθείας αυτά τα στοιχεία που δημιουργούνται και επεκτείνεται στη λειτουργία AI της Αναζήτησης Google, βελτιώνοντας τα αποτελέσματα αναζήτησης με διαδραστικά στοιχεία.
Ερευνητική εργασία με τίτλο «Generative UI: Τα LLM είναι αποτελεσματικά UI Generators», που κυκλοφόρησε μαζί με την ανακοίνωση, περιγράφει λεπτομερώς τη διαδικασία αξιολόγησης. Ανθρώπινοι αξιολογητές εξέτασαν τις διεπαφές που δημιουργήθηκαν από την τεχνητή νοημοσύνη έναντι των εξόδων τυπικών μεγάλων γλωσσικών μοντέλων, εξαιρουμένης της ταχύτητας παραγωγής ως μεταβλητής. Τα αποτελέσματα έδειξαν μεγάλη προτίμηση για τις διαδραστικές διεπαφές, υποδεικνύοντας την αποτελεσματικότητά τους στην αφοσίωση και την κατανόησή τους. Αυτή η δημοσίευση, που συντάχθηκε από ερευνητές της Google, παρέχει υποστήριξη για την τεχνολογία του Fellow Leviat, συμπεριλαμβανομένου του Fellow Yaniv’s.
Μέσα στην εφαρμογή Gemini, η Google δοκιμάζει δύο ξεχωριστές υλοποιήσεις του Generative UI. Η δυναμική προβολή αξιοποιεί τις ικανότητες κωδικοποίησης του Gemini 3 για να σχεδιάζει και να κωδικοποιεί προσαρμοσμένες διεπαφές για κάθε μεμονωμένη προτροπή. Αυτή η διαδικασία περιλαμβάνει την ανάλυση του πλαισίου του μηνύματος για την προσαρμογή τόσο του περιεχομένου που παρουσιάζεται όσο και των διαδραστικών χαρακτηριστικών που περιλαμβάνονται, διασφαλίζοντας τη συνάφεια με την πρόθεση του χρήστη. Για παράδειγμα, το σύστημα δημιουργεί κώδικα εν κινήσει για να δημιουργήσει στοιχεία όπως κουμπιά, φόρμες ή απεικονίσεις που ανταποκρίνονται στις εισροές των χρηστών σε πραγματικό χρόνο.
Η υλοποίηση οπτικής διάταξης, αντίθετα, παράγει προβολές σε στυλ περιοδικού που διαθέτουν αρθρωτά διαδραστικά στοιχεία. Οι χρήστες λαμβάνουν μια δομημένη διάταξη που μοιάζει με ψηφιακή δημοσίευση, με ενότητες που μπορούν να επεκταθούν, να τροποποιηθούν ή να αλληλεπιδράσουν περαιτέρω. Αυτή η μορφή επιτρέπει την οπτική αφήγηση σε συνδυασμό με λειτουργικότητα, όπως στοιχεία με δυνατότητα μεταφοράς ή ενσωματωμένες προσομοιώσεις, καθιστώντας τις σύνθετες πληροφορίες πιο προσιτές μέσω γραφικών μέσων.
Η Google δίνει έμφαση στην ικανότητα της τεχνολογίας να εξατομικεύει τα αποτελέσματα ανάλογα με το κοινό. Όπως αναφέρεται στο ερευνητικό ιστολόγιο της εταιρείας, “Προσαρμίζει την εμπειρία με την κατανόηση ότι η εξήγηση του μικροβιώματος σε ένα 5χρονο παιδί απαιτεί διαφορετικό περιεχόμενο και διαφορετικό σύνολο χαρακτηριστικών από το να το εξηγήσεις σε έναν ενήλικα”. Αυτή η προσαρμογή περιλαμβάνει την προσαρμογή της πολυπλοκότητας της γλώσσας, των οπτικών βοηθημάτων και των επιπέδων αλληλεπίδρασης ώστε να ταιριάζουν με τις γνώσεις και την ηλικία του παραλήπτη, με βάση τις συλλογιστικές δυνατότητες του μοντέλου με βάση τα συμφραζόμενα.
Στην Αναζήτηση Google, η πρόσβαση στο Generative UI πραγματοποιείται μέσω της Λειτουργίας AI, που περιορίζεται στους συνδρομητές Google AI Pro και Ultra στις Ηνωμένες Πολιτείες. Οι χρήστες το ενεργοποιούν επιλέγοντας «Thinking» από το αναπτυσσόμενο μενού μοντέλου, το οποίο στη συνέχεια επεξεργάζεται ερωτήματα για να δημιουργήσει προσαρμοσμένα διαδραστικά εργαλεία και προσομοιώσεις. Αυτή η ενοποίηση εμπλουτίζει τις εμπειρίες αναζήτησης παρέχοντας πρακτικές εξερευνήσεις θεμάτων, όπως οικονομικές αριθμομηχανές ή επιστημονικά μοντέλα, απευθείας μέσα στη διεπαφή αναζήτησης.
Βίντεο: Google
Το υποκείμενο σύστημα συνδυάζει το Gemini 3 Pro με συγκεκριμένες βελτιώσεις: η πρόσβαση στο εργαλείο επιτρέπει τη δημιουργία εικόνων και ενσωματώσεις αναζήτησης ιστού, επιτρέποντας στο AI να ενσωματώνει δεδομένα και γραφικά σε πραγματικό χρόνο σε διεπαφές. Οι προσεκτικά σχεδιασμένες οδηγίες συστήματος καθοδηγούν τη συμπεριφορά του μοντέλου ώστε να ευθυγραμμιστεί με τις προσδοκίες των χρηστών, ενώ τα βήματα μετά την επεξεργασία διορθώνουν κοινά σφάλματα, όπως ασυνέπειες διάταξης ή ανακρίβειες πραγματικών στοιχείων. Αυτά τα στοιχεία συνεργάζονται για να βελτιώσουν τα αποτελέσματα πριν από την παρουσίαση.
Για να προωθήσει την εξωτερική έρευνα, η Google ανέπτυξε το σύνολο δεδομένων PAGEN, που περιλαμβάνει ιστότοπους σχεδιασμένους από ειδικούς σε διάφορους τομείς. Αυτή η συλλογή χρησιμεύει ως σημείο αναφοράς για την εκπαίδευση και την αξιολόγηση μοντέλων παραγωγής διεπαφής χρήστη. Το σύνολο δεδομένων θα γίνει σύντομα διαθέσιμο στην ευρύτερη ερευνητική κοινότητα, διευκολύνοντας τις μελέτες για τη δημιουργία και βελτίωση διεπαφής με γνώμονα την τεχνητή νοημοσύνη.
Βίντεο: Google
Οι τρέχουσες εκδόσεις του Generative UI παρουσιάζουν ορισμένους περιορισμούς. Οι χρόνοι δημιουργίας συχνά υπερβαίνουν το ένα λεπτό, ανάλογα με την πολυπλοκότητα της προτροπής και της διεπαφής που απαιτείται. Τα αποτελέσματα περιστασιακά περιέχουν ανακρίβειες, όπως εσφαλμένες αναπαραστάσεις δεδομένων ή λειτουργικές δυσλειτουργίες, τις οποίες η Google προσδιορίζει ως ενεργούς τομείς έρευνας. Οι προσπάθειες επικεντρώνονται στη βελτιστοποίηση της ταχύτητας και της αξιοπιστίας μέσω επαναληπτικών ενημερώσεων μοντέλων και βελτιωμένων τεχνικών επεξεργασίας.
Αυτή η αποκάλυψη ευθυγραμμίζεται με την κυκλοφορία του Gemini 3, του πιο προηγμένου μοντέλου τεχνητής νοημοσύνης της Google μέχρι σήμερα. Το Gemini 3 Pro πέτυχε βαθμολογία 1.501 στον βαθμολογικό πίνακα LMARena, ξεπερνώντας τις προηγούμενες επαναλήψεις στις συνολικές μετρήσεις απόδοσης. Στο σημείο αναφοράς GPQA Diamond, σχεδιασμένο για συλλογιστικές εργασίες σε επίπεδο διδακτορικού, έφτασε το 91,9 τοις εκατό ακρίβεια. Επιπλέον, χωρίς εξωτερικά εργαλεία, σημείωσε 37,5 τοις εκατό στο Humanity’s Last Exam, ένα ολοκληρωμένο τεστ προηγμένων γνώσεων σε όλους τους κλάδους.
VIA: DataConomy.com





.jpg)




