Η τεχνητή νοημοσύνη φαίνεται πως πλησιάζει ολοένα και περισσότερο σε ένα μέλλον όπου η διάγνωση σοβαρών ασθενειών, όπως ο καρκίνος, θα μπορεί να γίνεται με έναν απλό και μη επεμβατικό τρόπο: μέσω της ανθρώπινης φωνής. Μια νέα επιστημονική προσέγγιση, που προς το παρόν εστιάζει στον καρκίνο του λάρυγγα, ανοίγει τον δρόμο για την αξιοποίηση «αόρατων» φωνητικών μοτίβων ως πρώιμων ενδείξεων νόσου.
Ο καρκίνος του λάρυγγα –γνωστός και ως «φωνητικό κουτί»– εξακολουθεί να αποτελεί ένα σημαντικό πρόβλημα δημόσιας υγείας σε παγκόσμιο επίπεδο. Ενδεικτικά, το 2021 καταγράφηκαν περίπου 1,1 εκατομμύρια νέα περιστατικά, ενώ οι θάνατοι έφτασαν τις 100.000. Παράγοντες όπως το κάπνισμα, η υπερβολική κατανάλωση αλκοόλ και η λοίμωξη από τον ιό HPV αυξάνουν σημαντικά τον κίνδυνο εμφάνισης της νόσου. Τα ποσοστά επιβίωσης διαφοροποιούνται έντονα, κυμαινόμενα από 35% έως 78% σε βάθος πενταετίας, ανάλογα με το στάδιο διάγνωσης και τη θέση του όγκου.
Η έγκαιρη διάγνωση αποτελεί καθοριστικό παράγοντα για την επιτυχή αντιμετώπιση της νόσου. Ωστόσο, οι σημερινές διαγνωστικές μέθοδοι –όπως η ρινοενδοσκόπηση με βίντεο και οι βιοψίες– είναι επεμβατικές, απαιτούν εξειδικευμένο εξοπλισμό και συχνά δεν είναι άμεσα διαθέσιμες. Επιπλέον, η καθυστέρηση στην αναζήτηση ιατρικής βοήθειας μπορεί να οδηγήσει σε καθυστερημένη διάγνωση και θεραπεία.
Μέσα σε αυτό το πλαίσιο, νέα μελέτη που δημοσιεύθηκε στο επιστημονικό περιοδικό «Frontiers in Digital Health» προτείνει μια καινοτόμο εναλλακτική: την αξιοποίηση της φωνής ως διαγνωστικού εργαλείου. Οι ερευνητές διαπίστωσαν ότι ακόμα και πολύ λεπτές μεταβολές στη φωνή μπορούν να αποκαλύψουν ανωμαλίες στις φωνητικές χορδές. Οι αλλοιώσεις αυτές μπορεί να είναι καλοήθεις, όπως οζίδια ή πολύποδες, αλλά σε ορισμένες περιπτώσεις συνδέονται με τα πρώιμα στάδια καρκίνου του λάρυγγα.
Η μελέτη δείχνει ότι η τεχνητή νοημοσύνη μπορεί να αξιοποιήσει αυτά τα φωνητικά «ίχνη» ως βιοδείκτες, συμβάλλοντας στην έγκαιρη ανίχνευση της νόσου. Όπως εξηγεί ο επικεφαλής ερευνητής, Δρ. Φίλιπ Τζένκινς από το Πανεπιστήμιο Υγείας και Επιστήμης του Όρεγκον, τα δεδομένα επιτρέπουν τη διάκριση μεταξύ φωνών ασθενών με βλάβες στις φωνητικές χορδές και ατόμων χωρίς τέτοιες αλλοιώσεις.
Η έρευνα εντάσσεται στο έργο «Bridge2AI-Voice», το οποίο αποτελεί μέρος μιας ευρύτερης πρωτοβουλίας των Εθνικών Ινστιτούτων Υγείας των ΗΠΑ για την ενσωμάτωση της τεχνητής νοημοσύνης στη βιοϊατρική. Στο πλαίσιο αυτό, οι επιστήμονες ανέλυσαν 12.523 ηχογραφήσεις από 306 άτομα στη Βόρεια Αμερική, εξετάζοντας χαρακτηριστικά όπως ο τόνος, το ύψος, η ένταση και η καθαρότητα της φωνής.
Μεταξύ των παραμέτρων που μελετήθηκαν ήταν η θεμελιώδης συχνότητα (pitch), το jitter (μικροδιακυμάνσεις στο ύψος της φωνής), το shimmer (μεταβολές στο πλάτος) και ο λόγος αρμονικού προς θόρυβο, ο οποίος αποτυπώνει τη σχέση μεταξύ καθαρού ήχου και ανεπιθύμητου θορύβου. Τα αποτελέσματα έδειξαν σαφείς διαφορές, κυρίως στους άνδρες, μεταξύ υγιών ατόμων, ασθενών με καλοήθεις βλάβες και ασθενών με καρκίνο του λάρυγγα. Αντίστοιχα μοτίβα δεν καταγράφηκαν στις γυναίκες, γεγονός που οι ερευνητές αποδίδουν στο μικρότερο δείγμα και εκτιμούν ότι μπορεί να αλλάξει με περισσότερα δεδομένα.
Ιδιαίτερο ενδιαφέρον παρουσιάζει ο λόγος αρμονικού προς θόρυβο, ο οποίος φαίνεται να αποτελεί έναν αξιόπιστο δείκτη για την παρακολούθηση της εξέλιξης των βλαβών στις φωνητικές χορδές και πιθανώς για την πρώιμη ανίχνευση καρκίνου, κυρίως στον ανδρικό πληθυσμό.
Τα ευρήματα αυτά ενισχύουν την προοπτική να μετατραπεί η φωνή σε έναν πρακτικό και εύχρηστο βιοδείκτη στην καθημερινή κλινική πράξη. Ωστόσο, οι επιστήμονες τονίζουν ότι απαιτείται περαιτέρω έρευνα. Το επόμενο βήμα περιλαμβάνει την εκπαίδευση αλγορίθμων σε ακόμη μεγαλύτερα και πιο αντιπροσωπευτικά σύνολα δεδομένων, καθώς και τη δοκιμή τους σε πραγματικά κλινικά περιβάλλοντα.
Παράλληλα, ιδιαίτερη έμφαση θα δοθεί στη διασφάλιση ότι τα συστήματα αυτά λειτουργούν με την ίδια ακρίβεια σε άνδρες και γυναίκες. Ήδη, πιλοτικά εργαλεία υγείας που βασίζονται στη φωνή βρίσκονται σε φάση δοκιμών, και σύμφωνα με τους ερευνητές, μέσα στα επόμενα χρόνια ενδέχεται να δούμε παρόμοιες εφαρμογές να περνούν σε ευρύτερη χρήση.
Αν οι εξελίξεις αυτές επιβεβαιωθούν, η καθημερινή ομιλία θα μπορούσε στο μέλλον να αποτελέσει ένα απλό αλλά ισχυρό «παράθυρο» στην υγεία μας, επιτρέποντας την έγκαιρη διάγνωση ασθενειών χωρίς επεμβατικές διαδικασίες.

