Ένα νέο μοντέλο τεχνητής νοημοσύνης από ερευνητές της Ιατρικής Σχολής του Στάνφορντ, ΗΠΑ, αξιοποιεί δεδομένα που συλλέγονται από μία μόνο νύχτα ύπνου για να προβλέψει τον κίνδυνο εμφάνισης πάνω από 100 διαφορετικών παθήσεων.
Το μοντέλο με την ονομασία SleepFM, εκπαιδεύτηκε σε σχεδόν 600.000 ώρες δεδομένων ύπνου διασκορπισμένων από 65.000 συμμετέχοντες. Χρησιμοποιεί δεδομένα πολυυπνογραφίας, μιας διαγνωστικής εξέτασης που καταγράφει τη φυσιολογία του ύπνου για τη διάγνωση διαταραχών. Κατά τη διάρκεια της διαδικασίας, διάφοροι αισθητήρες καταγράφουν εγκεφαλική δραστηριότητα, καρδιακή λειτουργία, αναπνοή και άλλες παραμέτρους.
Η πολυυπνογραφία θεωρείται το «χρυσό πρότυπο» στις μελέτες ύπνου. Οι ερευνητές ανακάλυψαν ότι πρόκειται για έναν ανεκμετάλλευτο θησαυρό φυσιολογικών δεδομένων.
«Καταγράφουμε έναν εντυπωσιακό αριθμό σημάτων από τον ύπνο», δήλωσε ο Εμανουέλ Μινιό, καθηγητής Ιατρικής του Ύπνου και συν-επικεφαλής της έρευνας που δημοσιεύθηκε στο Nature Medicine. «Τα δεδομένα είναι πολύ πλούσια και μας επιτρέπουν να μελετήσουμε τη γενική φυσιολογία του ανθρώπου σε πλήρη διαθέσιμη κατάσταση» πρόσθεσε.
Ωστόσο, σήμερα μόνο ένα μικρό μέρος αυτών των δεδομένων χρησιμοποιείται στην έρευνα και την ιατρική του ύπνου. Με τις πρόσφατες εξελίξεις στην τεχνητή νοημοσύνη, είναι εφικτό να αναλυθεί ένα πολύ μεγαλύτερο ποσοστό των δεδομένων. Η νέα αυτή μελέτη είναι η πρώτη που αξιοποιεί την τεχνητή νοημοσύνη για την ανάλυση δεδομένων ύπνου σε τέτοια μεγάλη κλίμακα.
Διαβάστε επίσης: Επιστήμονες εντόπισαν πέντε “προφίλ ύπνου”
Η «γλώσσα» του ύπνου
Για να αξιοποιήσουν τα δεδομένα, οι ερευνητές ανέπτυξαν ένα μοντέλο τεχνητής νοημοσύνης (foundation model) που μπορεί να εκπαιδευτεί αυτόνομα σε μεγάλες ποσότητες πληροφοριών. Τα μεγάλα γλωσσικά μοντέλα, όπως το ChatGPT, αποτελούν χαρακτηριστικά παραδείγματα αυτής της τεχνολογίας.
Οι 585.000 ώρες δεδομένων πολυυπνογραφίας που χρησιμοποιήθηκαν για την εκπαίδευση του SleepFM προήλθαν από ασθενείς που μελετήθηκαν σε διάφορες κλινικές ύπνου. Τα δεδομένα αυτά χωρίστηκαν σε τμήματα πέντε δευτερολέπτων, αντίστοιχα με τις «λέξεις» που χρησιμοποιούν τα γλωσσικά μοντέλα στην εκπαίδευσή τους.
«Το SleepFM μαθαίνει τη γλώσσα του ύπνου», σημείωσε ο Τζέιμς Ζου, αναπληρωτής καθηγητής βιοϊατρικής επιστήμης δεδομένων και συν-επικεφαλής της μελέτης.
Το μοντέλο αναλύει ταυτόχρονα πολλές ροές δεδομένων —όπως ηλεκτροεγκεφαλογραφήματα, ηλεκτροκαρδιογραφήματα και αναπνευστικές μετρήσεις— και κατανοεί τις αλληλεπιδράσεις τους.
Οι ερευνητές ανέπτυξαν μια νέα τεχνική εκπαίδευσης, γνωστή ως «leave-one-out contrastive learning», στην οποία «αποκρύπτεται» μια κατηγορία δεδομένων και το μοντέλο καλείται να ανασυνθέσει το κενό στοιχείο με βάση τα υπολειπόμενα σήματα.
«Μια από τις καινοτομίες αυτής της μελέτης ήταν το πώς εναρμονίσαμε διάφορες μορφές δεδομένων ώστε να μάθουν την ίδια “γλώσσα”», ανέφερε ο Ζου.
Πρόβλεψη ασθενειών
Μετά τη φάση εκπαίδευσης, οι ερευνητές βελτίωσαν το μοντέλο για διάφορες εφαρμογές. Αρχικά το δοκίμασαν σε τυπικές εργασίες ανάλυσης ύπνου, όπως η ταξινόμηση των σταδίων ύπνου και η διάγνωση υπνικής άπνοιας. Το SleepFM αποδείχθηκε εξίσου ή και καλύτερα από προηγμένα μοντέλα που χρησιμοποιούνται σήμερα.
Ακολουθώντας έναν πιο φιλόδοξο στόχο, οι ερευνητές προσπάθησαν να προβλέψουν μελλοντικές ασθένειες με βάση τα δεδομένα ύπνου. Τα δεδομένα πολυυπνογραφίας συγκρίθηκαν με τα ιατρικά αρχεία των συμμετεχόντων, τα οποία είχαν πρόσβαση σε περισσότερα από 50 χρόνια αναγνώσεων.
Η εκπαίδευση του SleepFM χρησιμοποίησε δεδομένα από περίπου 35.000 ασθενείς, ηλικίας 2 έως 96 ετών, που καταγράφηκαν από το πανεπιστήμιο μεταξύ 1999 και 2024. Συγκρίθηκαν με ηλεκτρονικά αρχεία υγείας που, για ορισμένους, καλύπτουν έως 25 χρόνια παρακολούθησης.
Το SleepFM ανέλυσε πάνω από 1.000 κατηγορίες ασθενειών και διαπίστωσε ότι 130 από αυτές μπορούσαν να προβλεφθούν με ικανοποιητική ακρίβεια. Ιδιαίτερα ισχυρές ήταν οι προβλέψεις για καρκίνους, καρδιοαγγειακές παθήσεις και ψυχικές διαταραχές, με δείκτη C άνω του 0,8. Ο δείκτης C είναι ένα μέτρο προγνωστικής ακρίβειας που δείχνει πόσο καλά ένα μοντέλο μπορεί να προβλέψει ποιο άτομο θα εκδηλώσει πρώτο ένα συγκεκριμένο σύμπτωμα.
Η απόδοση του SleepFM στην πρόβλεψη ασθενειών, όπως η νόσος Πάρκινσον (0,89) και η άνοια (0,85), επαληθεύει την αξία του μοντέλου, αναφέρει ο Ζου.
Ερμηνεία του μοντέλου
Η ερευνητική ομάδα εργάζεται για τη βελτίωση των προβλέψεων του SleepFM προσθέτοντας δεδομένα από φορετές συσκευές, και για καλύτερη κατανόηση του πώς το μοντέλο λαμβάνει τις αποφάσεις του.
«Δεν μας εξηγεί τα συμπεράσματά του», δήλωσε ένας ερευνητής. «Αλλά έχουμε αναπτύξει τεχνικές ερμηνείας για να κατανοήσουμε πώς “βλέπει” όταν κάνει μια συγκεκριμένη πρόβλεψη» εξήγησε.
Οι ερευνητές σημειώνουν ότι οι καρδιακοί δείκτες παίζουν μεγαλύτερο ρόλο στις προβλέψεις καρδιοπαθειών, ενώ οι εγκεφαλικές ενδείξεις είναι πιο σημαντικές για ψυχικές διαταραχές. Ο συνδυασμός όλων των δεδομένων αύξησε την ακρίβεια.
«Πληροφορίες για την πρόβλεψη ασθενειών προήλθαν από την αντίθεση διαφορετικών καναλιών», σημείωσε ο Μινιό, προσθέτοντας ότι είναι σημαντικές οι αποκλίσεις μεταξύ εγκεφάλου και καρδιάς.
Σημείο αναφοράς: Medicalxpress

