Μια νέα φωνητική ενημέρωση ChatGPT έχει κάνει την αλληλεπίδραση με το chatbot πολύ πιο ευέλικτη από ό,τι στο παρελθόν, και νομίζω ότι είναι ένα παράδειγμα ενός από τα βασικά πράγματα που μπορούμε τελικά να περιμένουμε από το νέο Siri.
Ενώ η αλλαγή του OpenAI μπορεί να φαίνεται σαν μια σχετικά μικρή στην επιφάνεια, ήδη διαπιστώνω ότι μεταμορφώνει εντελώς την εμπειρία χρήσης του ChatGPT…
Κείμενο σε φωνή
Όταν πρωτοκυκλοφόρησε το ChatGPT, ήταν μόνο κείμενο. Αργότερα, η επέκταση της λειτουργικότητας στις φωνητικές αλληλεπιδράσεις είχε δύο επιπτώσεις.
Πρώτον, έκανε το chatbot να φαίνεται ακόμη περισσότερο σαν να μιμείται έναν άνθρωπο. Αυτό είναι ένα ολόκληρο θέμα από μόνο του, αλλά είμαι με Ντέιβ Γουάινερ και Τζον Γκρούμπερ πιστεύοντας ότι αυτό δεν πρέπει να είναι στόχος ενός chatbot. (Το OpenAI υποχώρησε τουλάχιστον από μια έκδοση που έδινε προτεραιότητα στη φιλικότητα έναντι της ακρίβειας.)
Δεύτερον, βελτίωσε τη χρηστικότητα. Είναι προφανώς πιο γρήγορο και πιο βολικό να μιλάς απλά σε ένα AI παρά να πληκτρολογείς και να διαβάζεις γραπτές απαντήσεις, τουλάχιστον για ορισμένους τύπους αλληλεπίδρασης.
Ωστόσο, υπάρχουν φορές που η αλληλεπίδραση με κείμενο και οπτική επαφή είναι πιο κατάλληλη και, ενώ ήταν υπέροχο να έχετε την επιλογή, θα μπορούσε να είναι απογοητευτικό όταν μπορούσατε να ολοκληρώσετε το 95% της δουλειάς με φωνή, αλλά στη συνέχεια έπρεπε να μεταβείτε σε κείμενο για πράγματα όπως να ζητήσετε από το ChatGPT να δημιουργήσει μια εικόνα.
Αυτό ίσχυε ιδιαίτερα επειδή οι δύο λειτουργίες ήταν διακριτές και θα μπορούσε να νιώθεις σαν να αλληλεπιδράς με δύο εντελώς ξεχωριστά μοντέλα ChatGPT – μια φωνή, η άλλη κείμενο.
Ενσωμάτωση των δύο
Η τελευταία ενημέρωση του ChatGPT ενσωματώνει αλληλεπιδράσεις κειμένου και φωνής.
Τώρα μπορείτε να χρησιμοποιήσετε το ChatGPT Voice απευθείας μέσα στη συνομιλία—δεν χρειάζεται ξεχωριστή λειτουργία. Μπορείτε να μιλήσετε, να παρακολουθήσετε την εμφάνιση των απαντήσεων, να αναθεωρήσετε προηγούμενα μηνύματα και να δείτε γραφικά όπως εικόνες ή χάρτες σε πραγματικό χρόνο.
Υποψιάζομαι ότι ένα από τα πράγματα που παίρνει την Apple περισσότερο από το αναμενόμενο είναι η παροχή ακριβώς αυτού του τύπου ενοποίησης. Ουσιαστικά, η εταιρεία το κάνει αντίστροφα: η Siri κυκλοφόρησε ως υπηρεσία μόνο φωνής και η Apple Intelligence έχει πλέον προσθέσει δυνατότητες που βασίζονται σε κείμενο, όπως η σύνοψη των email.
Το OpenAI φαίνεται να αντιμετωπίζει ορισμένες από τις προκλήσεις για την απόσυρση αυτού του είδους της ολοκλήρωσης. Στις αρχικές μου δοκιμές, μερικές φορές λειτουργεί εξαιρετικά καλά και άλλες όχι. Για παράδειγμα, το έχω βιώσει ισχυριζόμενος ότι μου έδειξε έναν χάρτη ενώ στην πραγματικότητα δεν το έχει κάνει.
Αυτό είναι το μέλλον του νέου Siri
Εάν η Siri πρόκειται να τηρήσει όλες τις υποσχέσεις που έχει δώσει η Apple για αυτήν, τότε θα χρειαστεί να κάνει ακριβώς αυτό και πολλά άλλα.
Θα χρειαστεί να είμαστε σε θέση να του δώσουμε φωνητικές οδηγίες και να του δίνουμε όχι μόνο προφορικές απαντήσεις αλλά και να χειριζόμαστε κείμενο και εικόνες.
Επιπλέον, θα πρέπει να λειτουργεί ως έξυπνος πράκτορας όταν αλληλεπιδρά με τις εγκατεστημένες εφαρμογές μας. Θα του δώσουμε μια οδηγία όπως “Κλείστε την πρώτη πτήση αύριο το πρωί από το Χίθροου προς το Λας Βέγκας” και θα χρησιμοποιήσει όποιες ταξιδιωτικές εφαρμογές έχουμε εγκαταστήσει για να εκτελέσει αυτήν την εργασία.
Αλλά η Apple μπορεί να καταλήξει να αναλαμβάνει υπεργολαβία
Η παροχή αυτών των δυνατοτήτων δεν είναι μικρό έργο. Η κριτική επιτροπή μου εξακολουθεί να είναι πολύ ανοιχτή σχετικά με το πόσο πιθανό είναι να φτάσει η Apple όχι μόνο με το πού βρίσκονται σήμερα τα chatbot AI, αλλά και το πού βρίσκονται θα είναι μέχρι την κυκλοφορία του νέου Siri. Πιστεύω ότι είναι πολύ πιθανό η Apple να πρέπει να αναθέσει υπεργολαβικά τις δυνατότητες AI σε άλλες εταιρείες.
Προσωπικά, δεν με ενδιαφέρει αν η τεχνολογία που χρησιμοποιείται είναι εγχώρια από την Apple ή έχει ανατεθεί στην τεχνολογία AI που παρέχεται από την OpenAI, την Google ή οποιονδήποτε άλλο. Αυτό που εγώ κάνω το ενδιαφέρον είναι δύο πράγματα.
Πρώτον, ότι η Apple προστατεύει το απόρρητό μας με προσαρμοσμένες διεπαφές με chatbot τρίτων, όπως ακριβώς κάνει με την εναλλακτική στο ChatGPT σήμερα. Όταν κάνουμε μια ερώτηση που η Siri δεν μπορεί να απαντήσει και επιστρέφει στο ChatGPT, οι αλληλεπιδράσεις μας δεν χρησιμοποιούνται ποτέ από το OpenAI για εκπαίδευση, επειδή αυτή η προστασία του απορρήτου είναι μέρος αυτού που έχει συμφωνήσει η Apple με την εταιρεία.
Δεύτερον, πόσο γρήγορα είναι σε θέση η Apple να παρέχει αυτήν την ευφυΐα στις συσκευές της. Το επόμενο έτος είναι απολύτως το μακρινό όριο για το πόσο καιρό μπορούμε ενδεχομένως να περιμένουμε. Αν η συμπλήρωση αυτής της προθεσμίας σημαίνει ότι αυτό που βρίσκεται κάτω από την κουκούλα του νέου Siri είναι μια προσαρμοσμένη έκδοση του ChatGPT, του Gemini ή κάτι άλλο εξ ολοκλήρου, αυτό είναι απολύτως εντάξει για μένα.
Ποιες είναι οι απόψεις σας για αυτό; Παρακαλώ μοιραστείτε τις σκέψεις σας στα σχόλια.
Τονισμένα αξεσουάρ
Via: 9to5mac.com










