Το OpenAI έχει ενοποιήσει ομάδες μηχανικής, προϊόντων και έρευνας τους τελευταίους δύο μήνες για να αναθεωρήσει τα μοντέλα ήχου του, προετοιμάζοντας μια πρώτη προσωπική συσκευή ήχου που θα κυκλοφορήσει σε περίπου ένα χρόνο, σύμφωνα με αναφορές από Οι Πληροφορίες.
Η γενική επισκευή στοχεύει βελτιώσεις στις δυνατότητες ήχου του OpenAI πέρα από τους τρέχοντες περιορισμούς. Το νέο μοντέλο ήχου της εταιρείας, που έχει προγραμματιστεί να κυκλοφορήσει στις αρχές του 2026, θα παράγει ομιλία με πιο φυσικό ήχο. Θα διαχειρίζεται τις διακοπές με τρόπο παρόμοιο με έναν πραγματικό συνομιλητή. Αυτό το μοντέλο θα επιτρέψει επίσης στο AI να μιλάει ταυτόχρονα ενώ ο χρήστης μιλάει, μια λειτουργία που τα υπάρχοντα μοντέλα δεν μπορούν να εκτελέσουν.
Το OpenAI σχεδιάζει μια οικογένεια συσκευών που τροφοδοτούνται από αυτήν την προηγμένη τεχνολογία ήχου. Τα πιθανά σχέδια περιλαμβάνουν γυαλιά ή έξυπνα ηχεία χωρίς οθόνη. Αυτές οι συσκευές στοχεύουν να λειτουργούν ως σύντροφοι και όχι απλά εργαλεία, ενσωματώνοντας απρόσκοπτα στις καθημερινές αλληλεπιδράσεις.
Ο πρώην επικεφαλής σχεδιασμού της Apple, Jony Ive, συμβάλλει στις πρωτοβουλίες υλικού του OpenAI. Η OpenAI απέκτησε την εταιρεία του io για 6,5 δισεκατομμύρια δολάρια τον Μάιο. Ο Ive δίνει προτεραιότητα στις αρχές σχεδίασης ήχου πρώτα για να αντιμετωπίσει τον εθισμό στις συσκευές. Όπως σημειώνει το The Information, ο Ive θεωρεί αυτήν την προσέγγιση ως μια ευκαιρία να «διορθώσει τα λάθη» των προηγούμενων gadgets των καταναλωτών.
Η ώθηση προς τις διεπαφές ήχου ευθυγραμμίζεται με τις ευρύτερες εξελίξεις του κλάδου. Τα έξυπνα ηχεία, με βοηθούς φωνής, υπάρχουν σε περισσότερο από το ένα τρίτο των σπιτιών στις ΗΠΑ. Αυτές οι συσκευές έχουν καθιερώσει τη φωνητική αλληλεπίδραση ως τυπικό οικιακό στοιχείο.
Η Meta παρουσίασε ένα χαρακτηριστικό για τα έξυπνα γυαλιά Ray-Ban που χρησιμοποιεί μια σειρά πέντε μικροφώνων. Αυτή η ρύθμιση βοηθά τους χρήστες να ακούν συνομιλίες σε θορυβώδη περιβάλλοντα. Η τεχνολογία μετατρέπει αποτελεσματικά τα γυαλιά σε μια κατευθυντική συσκευή ακρόασης τοποθετημένη στο πρόσωπο.
Η Google ξεκίνησε πειράματα τον Ιούνιο με τις “Audio Overviews”. Αυτή η δυνατότητα μετατρέπει τα αποτελέσματα αναζήτησης σε περιλήψεις συνομιλίας που παραδίδονται μέσω ήχου. Οι χρήστες λαμβάνουν προφορικές επισκοπήσεις αντί για οπτικές λίστες, διευκολύνοντας την πρόσβαση στις πληροφορίες hands-free.
Η Tesla ενσωματώνει το Grok και άλλα μεγάλα μοντέλα γλώσσας στα οχήματά της. Η ενσωμάτωση δημιουργεί φωνητικούς βοηθούς συνομιλίας ικανούς για φυσικό διάλογο. Αυτοί οι βοηθοί διαχειρίζονται εργασίες όπως η πλοήγηση και ο έλεγχος του κλίματος μέσω προφορικών εντολών και απαντήσεων.
Οι νεοφυείς επιχειρήσεις επιδιώκουν παρόμοιο ηχοκεντρικό υλικό με μικτά αποτελέσματα. Το Humane AI Pin, μια φορητή συσκευή χωρίς οθόνη, κατανάλωσε εκατοντάδες εκατομμύρια χρηματοδότηση πριν εμφανιστεί ως προειδοποιητική ιστορία στον τομέα. Το μενταγιόν Friend AI λειτουργεί ως κολιέ που καταγράφει πτυχές της ζωής των χρηστών ενώ παρέχει συντροφικότητα. Αυτή η συσκευή έχει δημιουργήσει ανησυχίες για το απόρρητο παράλληλα με αναφορές υπαρξιακού τρόμου μεταξύ των χρηστών.
Πρόσθετες νεοφυείς επιχειρήσεις αναπτύσσουν δακτυλίους τεχνητής νοημοσύνης που προβλέπεται να κάνουν το ντεμπούτο τους το 2026. Το Sandbar αντιπροσωπεύει μια προσπάθεια. Ένα άλλο περιλαμβάνει τον ιδρυτή της Pebble, Eric Migicovsky. Αυτά τα δαχτυλίδια επιτρέπουν στους χρήστες να συμμετέχουν σε συνομιλίες απευθείας με τη συσκευή στο χέρι τους. Οι παράγοντες φόρμας ποικίλλουν σε αυτά τα έργα —φορετές, μενταγιόν, δαχτυλίδια—αλλά όλοι δίνουν έμφαση στον ήχο ως την κύρια διεπαφή. Χώροι όπως σπίτια, αυτοκίνητα, ακόμη και το πρόσωπο εξελίσσονται σε διαδραστικά περιβάλλοντα ήχου.
VIA: DataConomy.com




