Το OpenAI ποντάρει πολλά στο audio AI και δεν είναι μόνο να κάνει το ChatGPT να ακούγεται καλύτερο. Σύμφωνα με νέα αναφορά από το The Information, η εταιρεία έχει ενώσει αρκετές ομάδες μηχανικής, προϊόντων και έρευνας τους τελευταίους δύο μήνες για να ανανεώσει τα μοντέλα ήχου της, όλα στο πλαίσιο της προετοιμασίας για την πρώτη προσωπική συσκευή ήχου που αναμένεται να κυκλοφορήσει σε περίπου ένα χρόνο.
Η κίνηση αντικατοπτρίζει προς τα πού κατευθύνεται ολόκληρη η βιομηχανία της τεχνολογίας – προς ένα μέλλον όπου οι οθόνες γίνονται θόρυβος φόντου και ο ήχος θα βρίσκεται στο επίκεντρο. Τα έξυπνα ηχεία έχουν ήδη μετατρέψει τους φωνητικούς βοηθούς σε περισσότερα από το ένα τρίτο των σπιτιών στις ΗΠΑ. Η Meta μόλις κυκλοφόρησε μια λειτουργία για τα έξυπνα γυαλιά Ray-Ban που χρησιμοποιεί μια διάταξη πέντε μικροφώνων για να σας βοηθήσει να ακούτε συνομιλίες σε θορυβώδη δωμάτια — μετατρέποντας ουσιαστικά το πρόσωπό σας σε συσκευή κατευθυντικής ακρόασης. Η Google, εν τω μεταξύ, άρχισε να πειραματίζεται τον Ιούνιο με τις “Audio Overviews” που μετατρέπουν τα αποτελέσματα αναζήτησης σε περιλήψεις συνομιλίας. Και η Tesla ενσωματώνει το Grok και άλλα LLM στα οχήματά της για να δημιουργήσει βοηθούς φωνής συνομιλίας που μπορούν να χειριστούν τα πάντα, από την πλοήγηση μέχρι τον έλεγχο του κλίματος μέσω φυσικού διαλόγου.
Δεν είναι μόνο οι τεχνολογικοί γίγαντες που τοποθετούν αυτό το στοίχημα. Ένα ετερόκλητο πλήρωμα startups έχει εμφανιστεί με την ίδια πεποίθηση, αν και με διάφορους βαθμούς επιτυχίας. Οι κατασκευαστές του Humane AI Pin έκαψαν εκατοντάδες εκατομμύρια προτού το φορετό τους χωρίς οθόνη γίνει μια προειδοποιητική ιστορία. Το μενταγιόν Friend AI, ένα κολιέ που καταγράφει τη ζωή σας και προσφέρει συντροφικότητα, έχει πυροδοτήσει ανησυχίες για το απόρρητο και υπαρξιακό τρόμο στο ίσο μέτρο. Και τώρα τουλάχιστον δύο εταιρείες, συμπεριλαμβανομένης της Sandbar και μία με το τιμόνι του ιδρυτή της Pebble, Eric Migicovsky, κατασκευάζουν δαχτυλίδια AI που αναμένεται να κάνουν το ντεμπούτο τους το 2026, επιτρέποντας στους χρήστες να μιλάνε κυριολεκτικά στο χέρι.
Οι παράγοντες μορφής μπορεί να διαφέρουν, αλλά η διατριβή είναι η ίδια: ο ήχος είναι η διεπαφή του μέλλοντος. Κάθε χώρος — το σπίτι σας, το αυτοκίνητό σας, ακόμη και το πρόσωπό σας — γίνεται διεπαφή.
Το νέο μοντέλο ήχου του OpenAI, που έχει προγραμματιστεί για τις αρχές του 2026, φέρεται να ακούγεται πιο φυσικό, να χειρίζεται τις διακοπές σαν πραγματικός συνομιλητής και ακόμη και να μιλάει ενώ μιλάτε, κάτι που δεν μπορούν να διαχειριστούν τα σημερινά μοντέλα. Η εταιρεία λέγεται επίσης ότι οραματίζεται μια οικογένεια συσκευών, που πιθανώς περιλαμβάνουν γυαλιά ή έξυπνα ηχεία χωρίς οθόνη, που λειτουργούν λιγότερο σαν εργαλεία και περισσότερο σαν συνοδούς.
Όπως σημειώνει το The Information, ο πρώην επικεφαλής σχεδιασμού της Apple, Jony Ive, ο οποίος εντάχθηκε στις προσπάθειες υλικού του OpenAI μέσω της εξαγοράς της εταιρείας του io από την εταιρεία 6,5 δισεκατομμυρίων δολαρίων τον Μάιο, έχει θέσει τη μείωση του εθισμού στις συσκευές ως προτεραιότητα, βλέποντας τη σχεδίαση ήχου ως μια ευκαιρία να «διορθωθούν τα λάθη» των προηγούμενων συσκευών καταναλωτών.
Via: techcrunch.com




