Forscher an der Technischen Universität Kaunas (KTU) haben ein künstliches Intelligenzmodell entwickelt, das Depressionen mit einer Genauigkeit von 97.53 % diagnostiziert. Dazu analysieren sie Sprache und neuronale Gehirnaktivität und stellen damit einen bedeutenden Durchbruch in der Diagnostik psychischer Gesundheit dar.
Weltweit sind etwa 280 Millionen Menschen von Depressionen betroffen. Eine genaue Diagnose dieser Krankheit stellt seit jeher eine große Herausforderung dar. Forschern an der Technischen Universität Kaunas (KTU) ist auf diesem Gebiet ein Durchbruch gelungen. Sie haben ein Modell künstlicher Intelligenz (KI) entwickelt, das Depressionen durch die Analyse von Sprachmustern und neuronaler Gehirnaktivität mit außergewöhnlicher Präzision erkennen kann.
„Depressionen sind eine der häufigsten psychischen Störungen mit verheerenden Folgen für den Einzelnen und die Gesellschaft. Deshalb entwickeln wir eine neue, objektivere Diagnosemethode, die in Zukunft für alle zugänglich sein könnte“, sagte Co-Autor Rytis Maskeliūnas, Professor an der Fakultät für Multimediatechnik der KTU, in einem Pressemitteilung.
Multimodaler Ansatz verbessert diagnostische Genauigkeit
Veröffentlicht Im Brain Sciences Journal heißt es, die Innovation basiere auf einem multimodalen Ansatz, der zwei Arten von Daten integriert: Sprache und elektrische Gehirnaktivität (EEG).
Die Forscher argumentieren, dass die meisten traditionellen Diagnosemethoden auf einer Art von Daten beruhen, dieser duale Ansatz jedoch ein umfassenderes Verständnis des emotionalen Zustands einer Person bietet.
Diese kombinierte Analyse erreichte eine beeindruckende Genauigkeit von 97.53 % bei der Diagnose von Depressionen, eine deutliche Verbesserung gegenüber bestehenden Methoden.
„Das liegt daran, dass die Stimme der Studie Daten hinzufügt, die wir noch nicht aus dem Gehirn extrahieren können“, fügte Maskeliūnas hinzu.
Stimm- und Gehirndaten: Ein wirkungsvolles diagnostisches Duo
Die Auswahl der Datenquellen sei sorgfältig abgewogen worden, sagt Musyyab Yousufi, ein Doktorand, der an dem Projekt mitwirkte. Er merkte an, dass Gesichtsausdrücke zwar Einblicke in den psychischen Zustand einer Person geben könnten, aber leicht manipuliert werden könnten.
„Wir haben uns für die Stimme entschieden, weil sie auf subtile Weise einen emotionalen Zustand offenbaren kann, wobei die Diagnose das Sprechtempo, die Betonung und die Gesamtenergie beeinflusst“, sagte Yousufi in der Pressemitteilung.
Ein weiterer wichtiger Aspekt war die Privatsphäre der Patienten. Traditionelle Methoden wie die Gesichtserkennung können die Privatsphäre verletzen, während Sprach- und EEG-Untersuchungen weniger invasive, aber ebenso informative Daten liefern.
„Das Sammeln und Kombinieren von Daten aus mehreren Quellen ist für die weitere Verwendung vielversprechender“, fügte Maskeliūnas hinzu.
Der Weg nach vorn: Verbesserung der Transparenz und des Verständnisses von KI
Das KTU-Forschungsteam nutzte für seine EEG-Daten den Multimodal Open Dataset for Mental Disorder Analysis (MODMA). Diese Daten wurden in einer kontrollierten Umgebung gesammelt, wobei die Teilnehmer fünf Minuten lang ruhten und die Augen geschlossen hielten. Gleichzeitig wurde die natürliche Sprache der Teilnehmer während einer Frage-und-Antwort-Runde und beim Beschreiben von Bildern aufgezeichnet.
Zur Verarbeitung dieser Daten wurden sie in Spektrogramme, visuelle Darstellungen der Signale, umgewandelt. Um in diesen Bildern Depressionsindikatoren zu identifizieren, wurden fortschrittliche Rauschfilter und ein modifiziertes DenseNet-121-Deep-Learning-Modell eingesetzt.
In Zukunft könnte dieses KI-Modell die Diagnose von Depressionen schneller und einfacher machen, möglicherweise Fernbeurteilungen erleichtern und subjektive Vorurteile reduzieren. Es bleiben jedoch noch Herausforderungen.
„Das Hauptproblem dieser Studien ist der Mangel an Daten, weil die Menschen dazu neigen, ihre psychische Gesundheit vertraulich zu behandeln“, erklärte Maskeliūnas.
Eine wichtige zukünftige Aufgabe für die Forscher besteht darin, die Fähigkeit des Algorithmus zu verbessern, seinen Diagnoseprozess klar zu erklären.
„Der Algorithmus muss noch lernen, die Diagnose verständlich zu erklären“, fügte Maskeliūnas hinzu.
Die umfassenderen Auswirkungen: Erklärbare KI im Gesundheitswesen
Da KI-Lösungen in sensiblen Bereichen wie Gesundheitswesen, Finanzen und Recht immer mehr an Bedeutung gewinnen, steigt die Nachfrage nach erklärbarer künstlicher Intelligenz (XAI). XAI zielt darauf ab, den Entscheidungsprozess von KI transparent zu machen, um so Vertrauen aufzubauen und sicherzustellen, dass diese Systeme zuverlässig in kritische Bereiche integriert werden können.
Mit dieser Entwicklung eröffnet die KTU einen vielversprechenden Weg hin zu genaueren, objektiveren und verständlicheren Depressionsdiagnosen und könnte die Art und Weise, wie psychische Probleme erkannt und behandelt werden, revolutionieren.