Φανταστείτε να βρίσκεστε σε ένα πολυσύχναστο εστιατόριο ή σε έναν θορυβώδη δρόμο. Η οχλοβοή είναι τόσο έντονη που δυσκολεύεστε να ακούσετε τον άνθρωπο που στέκεται ακριβώς δίπλα σας. Όταν αρχίζετε να μιλάτε, ο υπόλοιπος κόσμος «χαμηλώνει» την έντασή του, και οι φωνές της παρέας σας φτάνουν στα αυτιά σας κρυστάλλινες, απομονωμένες από το χάος. Αυτό ακριβώς υπόσχεται η νέα τεχνολογία που αναπτύχθηκε από ερευνητές του Πανεπιστημίου της Ουάσιγκτον.
Η ομάδα, γνωστή για τις προηγούμενες καινοτομίες της στον τομέα της «σημασιολογικής ακοής», επανέρχεται με ένα ακόμα πιο εξελιγμένο σύστημα: τα «προληπτικά ακουστικά βοηθήματα». Αυτά τα ακουστικά τεχνητής νοημοσύνης είναι ικανά να αναγνωρίζουν αυτόματα με ποιους συνομιλείτε και να απομονώνουν τις φωνές τους σε πραγματικό χρόνο, εξαλείφοντας όλα τα υπόλοιπα ηχητικά ερεθίσματα.
Πώς λειτουργεί η «Αόρατη» ασπίδα θορύβου
Η πρωτοποριακή διαφορά σε σχέση με τα προηγούμενα συστήματα είναι η αυτοματοποίηση. Ενώ οι παλαιότερες συσκευές απαιτούσαν από τους χρήστες να επικεντρωθούν στον συνομιλητή τους ή να πατήσουν ένα κουμπί, η νέα μέθοδος λειτουργεί αθόρυβα στο παρασκήνιο.
Ο μηχανισμός ενεργοποιείται μόλις ο χρήστης αρχίσει να μιλάει. Χρησιμοποιώντας μικρόφωνα που είναι ενσωματωμένα στα ακουστικά, το σύστημα καταγράφει τη φωνή του χρήστη και αναλύει τον ρυθμό της συζήτησης. Ένα εξειδικευμένο μοντέλο τεχνητής νοημοσύνης παρακολουθεί ποιος μιλάει και πότε. Μόλις εντοπίσει τις φωνές που συμμετέχουν στη συζήτηση, ένα δεύτερο μοντέλο φροντίζει να τις διαχωρίσει από το περιβάλλον, επιτρέποντας στον χρήστη να ακούει καθαρά τους συνομιλητές του, ενώ οι υπόλοιποι ήχοι μειώνονται στο ελάχιστο.
Δυνατότητα για πολλαπλούς συνομιλητές
Ένα από τα πιο εντυπωσιακά χαρακτηριστικά του πρωτοτύπου είναι η ικανότητά του να διαχειρίζεται ταυτόχρονα πολλούς ομιλητές. Σύμφωνα με την έρευνα, το σύστημα μπορεί να παρακολουθεί και να απομονώνει έως και τέσσερις διαφορετικούς συνομιλητές ταυτόχρονα. Αυτό το καθιστά ιδανικό για ομαδικές συζητήσεις, όπου η προσοχή μας συχνά εναλλάσσεται μεταξύ διαφορετικών προσώπων.
Η τεχνολογία είναι σχεδιασμένη ώστε να μην υπάρχει καθυστέρηση (lag) στον ήχο, κάτι που θα έκανε την επικοινωνία να φαίνεται αφύσικη. Αν και αυτή τη στιγμή απαιτεί τη σύνδεση των ακουστικών με έναν μικρό φορητό υπολογιστή για την επεξεργασία των δεδομένων, οι ερευνητές εργάζονται ήδη για τη σμίκρυνση του hardware, με στόχο να ενσωματωθούν πλήρως σε μελλοντικές συσκευές.
Ελπίδα για άτομα με προβλήματα ακοής
Η νέα αυτή τεχνολογία δεν προσφέρει απλώς άνεση στους μέσους χρήστες, αλλά φέρνει και ελπιδοφόρα νέα για τα άτομα με προβλήματα ακοής. Αν και τα σημερινά ακουστικά βαρηκοΐας ενισχύουν τον ήχο, συχνά δεν μπορούν να διακρίνουν την “χρήσιμη” ομιλία από τον γενικό θόρυβο, κουράζοντας τον χρήστη. Η προσέγγιση του Πανεπιστημίου της Ουάσιγκτον προσφέρει μια λύση στο λεγόμενο «πρόβλημα του πάρτι», βοηθώντας τον εγκέφαλο να ξεκουραστεί από την επαναλαμβανόμενη προσπάθεια διαχωρισμού ήχων.
Στις δοκιμές που πραγματοποιήθηκαν με 11 εθελοντές, τα αποτελέσματα ήταν ενθαρρυντικά. Οι συμμετέχοντες αξιολόγησαν την ποιότητα του ήχου με ενεργοποιημένη την AI ως υπερδιπλάσιας καθαρότητας σε σχέση με τον φυσικό ήχο.
Το μέλλον είναι Open Source
Αξιοσημείωτο είναι ότι οι ερευνητές δεν σκοπεύουν να κρατήσουν αυτή την τεχνολογία κλειδωμένη πίσω από πατέντες. Ο κώδικας για την εκπαίδευση των μοντέλων και την αναπαραγωγή του συστήματος είναι διαθέσιμος ανοιχτά, επιτρέποντας στους προγραμματιστές και τους μηχανικούς παγκοσμίως να πειραματιστούν και να βελτιώσουν περαιτέρω τη μέθοδο.
Αν και δεν θα δούμε άμεσα αυτά τα ακουστικά στα καταστήματα, η κατεύθυνση είναι σαφής. Η επόμενη γενιά των “wearables” δεν θα αρκείται απλώς στο να παίζει μουσική ή να ακυρώνει τον θόρυβο ενός αεροπλάνου. Θα γίνουν ενεργοί βοηθοί στην καθημερινότητά μας, ικανοί να κατανοούν το περιβάλλον στο οποίο βρισκόμαστε και να προσαρμόζουν την πραγματικότητά μας ανάλογα με τις ανάγκες μας.










