startup με έδρα την Καλιφόρνια Λεπτός Υπολογισμός αντιμετωπίζει το πρόβλημα της καταγραφής των φωνών των ανθρώπων σε θορυβώδη περιβάλλοντα με τα δικά της μοντέλα φωνητικής απομόνωσης — μια τεχνολογία που θα μπορούσε να ωφελήσει προϊόντα και υπηρεσίες τεχνητής νοημοσύνης που βασίζονται στη φωνή.
Οι καταναλωτικές εφαρμογές που χρησιμοποιούν φωνητική τεχνητή νοημοσύνη βλέπουν σήμερα τεράστια ανάπτυξη. Οι σημειωτές του AI Meeting όπως οι Granola, Fireflies, Fathom και Read AI έχουν τραβήξει την προσοχή τόσο των χρηστών όσο και των επενδυτών. Οι υπάρχουσες εταιρείες όπως οι OpenAI, ClickUp και Notion έχουν ενσωματωμένες λύσεις μεταγραφής φωνής. Οι κατασκευαστές εφαρμογών όπως οι Wispr Flow και Willow εργάζονται στη φωνητική υπαγόρευση. Στη συνέχεια, υπάρχουν εταιρείες υλικού όπως η Plaud και η Sandbar που χρησιμοποιούν συσκευές ως μέσο για να μεταγράψουν τη φωνή σας και, στη συνέχεια, χρησιμοποιούν AI για τη δημιουργία πληροφοριών και την αλληλεπίδραση.
Μία από τις προκλήσεις για αυτές τις εταιρείες είναι να καταγράψουν τις φωνές των χρηστών σε κάθε είδους περιβάλλον, όπως δυνατά καφέ ή γραφεία.
Για να το αντιμετωπίσει αυτό, η Subtle Computing ανέπτυξε ένα μοντέλο φωνητικής απομόνωσης από άκρο σε άκρο που μπορεί να καταλάβει τι λέτε ακόμα και σε θορυβώδη περιβάλλοντα. Ο Τσεν είπε ότι υπάρχουν πολλές εταιρείες που εργάζονται για την κατανόηση φωνής. Σημείωσε ότι κατά καιρούς, οι κατασκευαστές συσκευών στέλνουν τη φωνή στο cloud για να έχουν καθαρή έξοδο, αλλά αυτό δεν είναι αποτελεσματικό.
Η εκκίνηση εκπαιδεύει συγκεκριμένα μοντέλα για να ταιριάζουν στην ακουστική μιας συγκεκριμένης συσκευής και να προσαρμόζονται στη φωνή του χρήστη αντί να εκπαιδεύει ένα μοντέλο που λειτουργεί σε όλες τις συσκευές.
“Αυτό που βρήκαμε είναι ότι όταν διατηρούμε τα ακουστικά χαρακτηριστικά μιας συσκευής, έχουμε μια τάξη μεγέθους καλύτερη απόδοση από τις γενικές λύσεις. Αυτό σημαίνει επίσης ότι μπορούμε να δώσουμε εξατομικευμένες λύσεις στον χρήστη”, είπε ο Chen.
Η εταιρεία ιδρύθηκε από τους Tyler Chen, David Harrison, Savannah Cofer και Jackie Yang, οι οποίοι γνωρίστηκαν στο Stanford. Ο Chen, ο Harrison και ο Yang συνέχιζαν το διδακτορικό τους ενώ ο Cofer έκανε MBA. Συγκεντρώθηκαν στο μάθημα Lean Launchpad του Steve Blank, όπου εργάστηκαν σε εναλλακτικές διεπαφές για υπολογιστές και ξεκίνησαν να χτίζουν το Subtle Computing.
Εκδήλωση Techcrunch
Σαν Φρανσίσκο
|
13-15 Οκτωβρίου 2026
«Καθώς αλληλεπιδρούμε περισσότερο με την τεχνητή νοημοσύνη, προχωράμε προς ένα μέλλον όπου μιλάμε με τις συσκευές μας», είπε ο Τσεν. “Αλλά το προφανές ερώτημα είναι πόσο καταλαβαίνουν οι συσκευές μας, τους χρήστες, σε όλα τα περιβάλλοντα όπου εργαζόμαστε καθημερινά. Είτε πρόκειται για ένα πολύ δυνατό καφέ είτε για ένα κοινό γραφείο όπου υπάρχουν άλλοι άνθρωποι γύρω σας και μπορεί να μιλάτε για κάτι ιδιωτικό — η φωνή δεν λειτουργεί με αυτόν τον τρόπο σήμερα”, πρόσθεσε.
Η startup είπε ότι μπορεί να τρέξει το μοντέλο μόνο για φωνητική απομόνωση σε ορισμένες συσκευές, το οποίο έχει μέγεθος μόλις μερικά megabyte και έχει λανθάνουσα κατάσταση 100ms. Η εταιρεία μπορεί επίσης να εκτελέσει ένα διαφορετικό μοντέλο για να μεταγράψει τη φωνή και να δώσει έξοδο κειμένου για άλλες συσκευές. Ο Τσεν είπε ότι χάρη στο μοντέλο απομόνωσής του, το μοντέλο μεταγραφής της εταιρείας μπορεί να κατανοήσει καλύτερα τους χρήστες και με τη σειρά του να δημιουργήσει μια πιο ακριβή μεταγραφή.
Η Subtle Computing είπε ότι η Qualcomm επέλεξε την εκκίνηση ως μέλος του προγράμματος επέκτασης φωνής και μουσικής. Αυτό σημαίνει ότι η τεχνολογία της startup θα είναι συμβατή με τα τσιπ της Qualcomm και θα είναι διαθέσιμη σε συσκευές που παράγονται από OEM.
Η εταιρεία έχει συγκεντρώσει 6 εκατομμύρια δολάρια σε χρηματοδότηση εκκίνησης με επικεφαλής την Entrada Ventures, με τη συμμετοχή των Amplify Partners, Abstract Ventures και επενδυτών αγγέλων, συμπεριλαμβανομένων ιδρυτών όπως ο Biz Stone του Twitter, ο Evan Sharp του Pinterest και ο Johnny Ho του Perplexity.
Η Karen Roter Davis, Managing Partner στην Entrada Ventures και πρώην διευθύντρια ενός πρώιμου έργου στο X (Alphabet), σημείωσε ότι η φωνητική τεχνητή νοημοσύνη είναι ένας θορυβώδης χώρος και παρόλο που οι αλληλεπιδράσεις μέσω αυτού του μέσου αυξάνονται, η συνολική εμπειρία φωνής δεν είναι εξαιρετική. Πιστεύει ότι η εστίαση της startup στην απομόνωση φωνής φέρνει μια διαφορετική προοπτική στην αγορά.
«Ενώ μπορείτε να συζητήσετε εάν η τεχνητή νοημοσύνη θα αυξήσει ή θα μειώσει τον χρόνο που αφιερώνεται σε καθημερινή βάση, μπορούμε όλοι να συμφωνήσουμε ότι οι εξελίξεις στην υπολογιστική ισχύ και τη μηχανική μάθηση / τεχνητή νοημοσύνη παρέχουν ευκαιρίες για καινοτομίες στη φωνητική διεπαφή – αν γίνει σωστά», είπε ο Ντέιβις. “Το Subtle Computing συναντά ανθρώπους όπου βρίσκονται με φωνητικές διεπαφές που αντέχουν σε υπερβολικό θόρυβο και εξαιρετικά αθόρυβα, παρέχοντας μια φωνητική εμπειρία που είναι αξιόπιστη, εύκολη και διασκεδαστική. Αλλάζει το παιχνίδι”, πρόσθεσε.
Η εταιρεία είπε ότι έχει επίσης συνεργαστεί με μια μάρκα υλικού καταναλωτών και μια μάρκα αυτοκινήτου – χωρίς να τις κατονομάσει – για να αναπτύξει τις λύσεις της. Αλλά η Subtle Computing δεν θέλει να είναι απλώς ένας προμηθευτής μοντέλου σε άλλες εταιρείες.
Η startup είπε επίσης ότι σχεδιάζει να ανακοινώσει ένα καταναλωτικό προϊόν που θα καλύπτει τόσο το υλικό όσο και το λογισμικό το επόμενο έτος, χωρίς να προσφέρει λεπτομέρειες.
Via: techcrunch.com





