By using this site, you agree to the Privacy Policy and Terms of Use.
Accept
TechReport.grTechReport.grTechReport.gr
Search
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Reading: Μια μελέτη της Apple δείχνει ότι τα LLM μπορούν να καταλάβουν τι κάνετε από δεδομένα ήχου
Share
Sign In
Notification Show More
Font ResizerAa
TechReport.grTechReport.gr
Font ResizerAa
Search
Have an existing account? Sign In
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
TechReport.gr > Apple > Μια μελέτη της Apple δείχνει ότι τα LLM μπορούν να καταλάβουν τι κάνετε από δεδομένα ήχου
Apple

Μια μελέτη της Apple δείχνει ότι τα LLM μπορούν να καταλάβουν τι κάνετε από δεδομένα ήχου

Marizas Dimitris
Last updated: 22 Νοεμβρίου 2025 01:13
Marizas Dimitris
Share
SHARE


Contents
  • Είναι καλοί σε αυτό, αλλά όχι με ανατριχιαστικό τρόπο
  • Βουτήξτε λίγο πιο βαθιά
      • Προσφορές αξεσουάρ στο Amazon


Οι ερευνητές της Apple δημοσίευσαν μια μελέτη που εξετάζει τον τρόπο με τον οποίο τα LLM μπορούν να αναλύσουν δεδομένα ήχου και κίνησης για να έχουν μια καλύτερη επισκόπηση των δραστηριοτήτων του χρήστη. Εδώ είναι οι λεπτομέρειες.

Είναι καλοί σε αυτό, αλλά όχι με ανατριχιαστικό τρόπο

Μια νέα εφημερίδα με τίτλο “Χρήση LLM για όψιμη πολυτροπική σύντηξη αισθητήρα για αναγνώριση δραστηριότητας” προσφέρει μια εικόνα για το πώς η Apple μπορεί να σκέφτεται να ενσωματώσει την ανάλυση LLM μαζί με τα παραδοσιακά δεδομένα αισθητήρων για να αποκτήσει μια πιο ακριβή κατανόηση της δραστηριότητας των χρηστών.

Αυτό, υποστηρίζουν, έχει μεγάλες δυνατότητες να κάνει την ανάλυση δραστηριότητας πιο ακριβή, ακόμη και σε καταστάσεις όπου δεν υπάρχουν αρκετά δεδομένα αισθητήρων.

Από τους ερευνητές:

“Οι ροές δεδομένων αισθητήρων παρέχουν πολύτιμες πληροφορίες σχετικά με δραστηριότητες και το πλαίσιο για μεταγενέστερες εφαρμογές, αν και η ενσωμάτωση συμπληρωματικών πληροφοριών μπορεί να είναι δύσκολη. Δείχνουμε ότι τα μεγάλα γλωσσικά μοντέλα (LLM) μπορούν να χρησιμοποιηθούν για καθυστερημένη σύντηξη για ταξινόμηση δραστηριότητας από δεδομένα χρονοσειρών ήχου και κίνησης. Επιμεληθήκαμε ένα υποσύνολο δεδομένων για αναγνώριση διαφορετικής δραστηριότητας σε περιβάλλοντα (π.χ. Η ταξινόμηση 12 κλάσεων μηδενικής και μίας βολής βαθμολογείται σημαντικά πάνω από τις πιθανότητες, χωρίς εκπαίδευση σε συγκεκριμένη εργασία μέσω σύντηξης LLM από συγκεκριμένα μοντέλα, όπου υπάρχουν περιορισμένα ευθυγραμμισμένα δεδομένα εκπαίδευσης για την εκμάθηση ενός κοινόχρηστου χώρου ενσωμάτωσης, χωρίς προσθήκη LL υπολογισμός για στοχευμένα πολυτροπικά μοντέλα ειδικά για εφαρμογές.”

Με άλλα λόγια, τα LLM είναι στην πραγματικότητα πολύ καλά στο να συμπεράνουν τι κάνει ένας χρήστης από τα βασικά σήματα ήχου και κίνησης, ακόμη και όταν δεν είναι ειδικά εκπαιδευμένοι για αυτό. Επιπλέον, όταν δίνεται μόνο ένα παράδειγμα, η ακρίβειά τους βελτιώνεται ακόμη περισσότερο.

Μια σημαντική διάκριση είναι ότι σε αυτή τη μελέτη, το LLM δεν τροφοδοτήθηκε με την πραγματική ηχογράφηση, αλλά αντίθετα, σύντομες περιγραφές κειμένου που δημιουργήθηκαν από μοντέλα ήχου και ένα μοντέλο κίνησης που βασίζεται σε IMU (το οποίο παρακολουθεί την κίνηση μέσω δεδομένων επιταχυνσιόμετρου και γυροσκόπιου), όπως φαίνεται παρακάτω:

Βουτήξτε λίγο πιο βαθιά

Στο έγγραφο, οι ερευνητές εξηγούν ότι χρησιμοποίησαν το Ego4D, ένα τεράστιο σύνολο δεδομένων μέσων που γυρίστηκαν σε πρώτο πρόσωπο. Τα δεδομένα περιέχουν χιλιάδες ώρες πραγματικών περιβαλλόντων και καταστάσεων, από οικιακές εργασίες έως υπαίθριες δραστηριότητες.

Από τη μελέτη:

“Επιμελήσαμε ένα σύνολο δεδομένων καθημερινών δραστηριοτήτων από το σύνολο δεδομένων Ego4D αναζητώντας δραστηριότητες καθημερινής ζωής μέσα στις παρεχόμενες αφηγηματικές περιγραφές. Το επιμελημένο σύνολο δεδομένων περιλαμβάνει δείγματα 20 δευτερολέπτων από δώδεκα δραστηριότητες υψηλού επιπέδου: ηλεκτρική σκούπα, μαγείρεμα, πλύσιμο ρούχων, φαγητό, παιχνίδι μπάσκετ, παιχνίδι ποδοσφαίρου, παιχνίδι με κατοικίδια, ανάγνωση βιβλίων, ανάγνωση κατοικίδιων ζώων, ανάγνωση βιβλίων, ανάγνωση κατοικίδιων ζώων. προπόνηση/άρση βαρών Αυτές οι δραστηριότητες επιλέχθηκαν για να καλύπτουν μια σειρά από οικιακές εργασίες και εργασίες φυσικής κατάστασης και με βάση την επικράτηση τους στο μεγαλύτερο σύνολο δεδομένων.

Οι ερευνητές έτρεξαν τα δεδομένα ήχου και κίνησης μέσω μικρότερων μοντέλων που παρήγαγαν λεζάντες κειμένου και προβλέψεις τάξης και στη συνέχεια τροφοδοτούσαν αυτές τις εξόδους σε διαφορετικά LLM (Gemini-2.5-pro και Qwen-32B) για να δουν πόσο καλά μπορούσαν να αναγνωρίσουν τη δραστηριότητα.

Στη συνέχεια, η Apple συνέκρινε την απόδοση αυτών των μοντέλων σε δύο διαφορετικές καταστάσεις: μια στην οποία τους δόθηκε η λίστα με τις 12 πιθανές δραστηριότητες για να διαλέξουν (κλειστό σετ) και μια άλλη όπου δεν τους δόθηκε καμία επιλογή (ανοιχτό).

Για κάθε δοκιμή, τους δόθηκαν διαφορετικοί συνδυασμοί λεζάντες ήχου, ετικέτες ήχου, δεδομένα πρόβλεψης δραστηριότητας IMU και επιπλέον πλαίσιο, και έτσι έκαναν:

Στο τέλος, οι ερευνητές σημειώνουν ότι τα αποτελέσματα αυτής της μελέτης προσφέρουν ενδιαφέρουσες ιδέες για το πώς ο συνδυασμός πολλαπλών μοντέλων μπορεί να ωφελήσει δεδομένα δραστηριότητας και υγείας, ειδικά σε περιπτώσεις όπου τα ακατέργαστα δεδομένα αισθητήρων δεν επαρκούν από μόνα τους για να παρέχουν μια σαφή εικόνα της δραστηριότητας του χρήστη.

Ίσως το πιο σημαντικό, η Apple δημοσιευμένο συμπληρωματικό υλικό παράλληλα με τη μελέτη, συμπεριλαμβανομένων των αναγνωριστικών τμημάτων Ego4D, των χρονικών σημάνσεων, των προτροπών και των παραδειγμάτων μιας λήψης που χρησιμοποιήθηκαν στα πειράματα, για να βοηθήσουν τους ερευνητές που ενδιαφέρονται να αναπαράγουν τα αποτελέσματα.

Προσφορές αξεσουάρ στο Amazon

FTC: Χρησιμοποιούμε συνδέσμους θυγατρικών που κερδίζουν αυτόματα εισόδημα. Περισσότερο.



Via: 9to5mac.com

Gemini AI: Η Αναζήτηση του 2025 & το Κίνημα Τεχνολογικής Αποτοξίνωσης | Ανάλυση
Oracle Database 26ai Νέες δυνατότητες
7 λειτουργίες Android που κάνουν τα iPhone σε ντροπή
Το Proton Data Breach Observatory στοχεύει να σας ειδοποιεί σε σχεδόν πραγματικό χρόνο
Ανακαλύψτε την Επαναστατική Μέθοδο που Οι Χρήστες Android και iPhone Μπορούν Να Μοιράζονται Αρχεία Απίστευτα Εύκολα!
TAGGED:AmazonappleGeminiLLM

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.
[mc4wp_form]
By signing up, you agree to our Terms of Use and acknowledge the data practices in our Privacy Policy. You may unsubscribe at any time.
Share This Article
Facebook Copy Link Print
Share
ByMarizas Dimitris
Follow:
Ο Δημήτρης είναι παθιασμένος με την τεχνολογία και τις καινοτομίες. Λατρεύει να εξερευνά νέες ιδέες, να επιλύει σύνθετα προβλήματα και να βρίσκει τρόπους ώστε η τεχνολογία να γίνεται πιο ανθρώπινη, απολαυστική και προσιτή για όλους. Στον ελεύθερο χρόνο του ασχολείται με το σκάκι και το poker, απολαμβάνοντας την στρατηγική και τη δημιουργική σκέψη που απαιτούν.
Previous Article Η Jagex θα αφαιρέσει το Treasure Hunter από το RuneScape μετά την ψηφοφορία της κοινότητας
Next Article Εάν ο Κβαντικός Υπολογιστής λύνει «αδύνατα» ερωτήματα, πώς ξέρουμε ότι έχουν δίκιο;
Δεν υπάρχουν Σχόλια

Αφήστε μια απάντηση Ακύρωση απάντησης

Η ηλ. διεύθυνση σας δεν δημοσιεύεται. Τα υποχρεωτικά πεδία σημειώνονται με *

Stay Connected

248.1KLike
69.1KFollow
134KPin
54.3KFollow
banner banner
Create an Amazing Newspaper
Discover thousands of options, easy to customize layouts, one-click to import demo and much more.
Learn More

Latest News

Wall Street: Η Oracle απειλεί να «στείλει» την αγορά σε πτώση!
Wall Street: Οι Ενεργειακοί Γίγαντες Θριαμβεύουν Μετά την Επίθεση στη Βενεζουέλα – Αποκαλύψεις που θα σας Σοκάρουν!
Business
AMD Ryzen 7 9800X3D: Νέο overclock ρεκόρ στα 7.33 GHz
AMD Ryzen 7 9800X3D: Νέο overclock ρεκόρ στα 7.33 GHz
Technology
«Ανακαλύφθηκαν 360.000 μοριακοί κόμποι που ελέγχουν τα γονίδιά μας – Μάθετε πώς επηρεάζουν τη ζωή σας!»
«Ανακαλύφθηκαν 360.000 μοριακοί κόμποι που ελέγχουν τα γονίδιά μας – Μάθετε πώς επηρεάζουν τη ζωή σας!»
Technology
Το NETGEAR Nighthawk BE9300 είναι ένας ευέλικτος και υψηλής απόδοσης δρομολογητής Wi-Fi 7, που προσφέρει κάλυψη τριών ζωνών για παιχνίδια, ροή 4K και άλλα, για μόλις 189,99 $ στο Amazon
Το NETGEAR Nighthawk BE9300 είναι ένας ευέλικτος και υψηλής απόδοσης δρομολογητής Wi-Fi 7, που προσφέρει κάλυψη τριών ζωνών για παιχνίδια, ροή 4K και άλλα, για μόλις 189,99 $ στο Amazon
Technology

You Might also Like

Science

How to spend your remaining FSA balance before it expires

Marizas Dimitris
Marizas Dimitris
21 Min Read
Αποκτήστε ένα πρόγραμμα οδήγησης αντίκτυπου DeWalt 179 $ για 99 $ κατά τη διάρκεια της τεράστιας έκπτωσης της Μαύρης Παρασκευής της Amazon στα ηλεκτρικά εργαλεία DeWalt
Science

Αποκτήστε ένα πρόγραμμα οδήγησης αντίκτυπου DeWalt 179 $ για 99 $ κατά τη διάρκεια της τεράστιας έκπτωσης της Μαύρης Παρασκευής της Amazon στα ηλεκτρικά εργαλεία DeWalt

Marizas Dimitris
Marizas Dimitris
5 Min Read
Technology

Ο παίκτης των Knicks, Miles McBride, λανσάρει μια εφαρμογή φιλίας για κοινή χρήση τοποθεσίας για να ανταγωνιστεί το Snap Map

Marizas Dimitris
Marizas Dimitris
6 Min Read
//

We influence 20 million users and is the number one business and technology news network on the planet

Quick Link

  • Phones
    • iPhone – iOS
    • Android
    • Samsung
  • Computer
  • Internet
    • Security
  • Entertainment
    • Gaming
  • Business
  • Economics
    • Cryptos
  • Gadgets
  • Technology
    • Science
    • Reviews
    • How-To
  • Health
    • Psychology
  • Blog
  • My Bookmarks
  • Customize Interests
  • Home Technology
  • Contact
  • Technology Home 2
  • Technology Home 3
  • Technology Home 4
  • Technology Home 5

Support

  • Home
  • Πολιτική απορρήτου
  • Σχετικά με εμάς
  • Contact With TechReport
  • Greek Live Channels IPTV 2025

Sign Up for Our Newsletter

Subscribe to our newsletter to get our newest articles instantly!

[mc4wp_form id=”1616″]

TechReport.grTechReport.gr
Follow US
© 2022 Foxiz News Network. Ruby Design Company. All Rights Reserved.
Join Us!
Subscribe to our newsletter and never miss our latest news, podcasts etc..
[mc4wp_form]
Zero spam, Unsubscribe at any time.
Welcome Back!

Sign in to your account

Username or Email Address
Password

Lost your password?