Modell eines neuronalen Netzwerks
Ein Blick in ein Modell eines neuronalen Netzwerks im Technischen Museum Wien. Künstliche neuronale Netze sind Algorithmen, die dem menschlichen Gehirn nachempfunden sind und in Machine-Learning-Anwendungen in verschiedenen Bereichen der KI eingesetzt werden.
APA/ROLAND SCHLAGER

Der Weg zu den richtigen Antidepressiva ist für viele Patienten lang und mühevoll. Die Präparate wirken oft erst nach vier bis sechs Wochen. Bei etwa 65 Prozent ist die erste Wahl richtig, die anderen müssen zurück an den Start, der Leidensweg verlängert sich. Neue Methoden der Künstlichen Intelligenz (KI) könnten hier Abhilfe schaffen: Claudia Plant, Leiterin der Forschungsgruppe Data Mining und Machine Learning an der Universität Wien, stellt sich mit ihrem Team etwa die Frage, ob sich die Wirksamkeit der Präparate schon früher, wenige Tage nach Einnahme, anhand neuronaler Signale im Gehirn abschätzen lässt.

In dem Projekt, das vom Wissenschaftsfonds FWF gefördert wird, suchen Plant und Informatikkolleginnen und -kollegen in Wien und Prag nach relevanten Synchronisationsmuster in Gehirnstromdaten. Die Neurologie ist aber nur einer der Anwendungsbereiche, denen die Wiener KI-Expertinnen und -Experten zuarbeiten. Andere Forschungsarbeiten der Arbeitsgruppe suchen nach Mustern in Daten aus dem Energiemarkt oder zu archäologischen Fundstücken. So verschieden die Anwendungsbereiche sind, eines haben die Projekte gemein: Sie versuchen, mittels KI neue Möglichkeiten zur Analyse großer Datenbestände zu finden.

Person in dunklem Gang
Künstliche Intelligenz könnte in Zukunft dabei helfen, für Menschen mit Depressionen schneller und treffsicher die passenden Medikamente zu finden.
Getty Images
"Viele Fragestellungen rund um große und rechenintensive KI-Modelle können wir mangels Kapazitäten kaum bearbeiten. Sie werden damit letztendlich den großen KI-Konzernen in den USA und China überlassen." – Computerwissenschafterin Claudia Plant

Zutaten für gute Ergebnisse

"Hat man eine Aufgabe, in der sowohl ein klar vorgegebenes Lernziel als auch eine große Menge an Trainingsdaten vorhanden sind, bieten bestehende Methoden gute Möglichkeiten. Fehlen diese Zutaten, ist es dagegen sehr viel schwieriger, gute Ergebnisse zu erzielen", erklärt Plant, die sich mit ihrem Team genau diesen Schwierigkeiten stellt. Bei dem Neurologieprojekt gibt es etwa nur eine überschaubare Anzahl von Trainingsdaten, auf denen man aufbauen kann, aber eine Vielzahl von Medikamenten und Wirkungsmustern.

Zu den Forschungsbereichen der Informatikerin, die demnächst auch Teil der Podiumsdiskussion "Wissen wir, was KI wissen wird?" im Zuge der "Semesterfrage" der Uni Wien sein wird, gehört sogenanntes parameterfreies Data-Mining. "Das Ideal wäre, dass Algorithmen interessante Muster in Daten automatisch finden, dabei aber ohne Lernziel – also ohne Vorgaben, wonach man eigentlich sucht – auskommen", beschreibt Plant. Auch wenn diese Vision noch nicht Realität ist, kommen ihr manche Ansätze zumindest schon sehr nahe.

Eine Idee, wie sich eine ergebnisoffene Suche realisieren lässt, basiert auf der Informationstheorie des US-Mathematikers Claude Shannon. Grob gesagt hat er definiert, wie groß die Störung eines Kommunikationskanals sein darf, sodass der Informationsgehalt einer Übertragung gerade noch fehlerfrei rekonstruiert werden kann. Sein Ansatz wurde zur Grundlage heutiger Datenkomprimierungsalgorithmen, die also Datenbestände auf einen wesentlichen Informationsgehalt reduzieren und den ursprüngliche Zustand später wieder rekonstruieren können.

Rechenzentrum
Rechenzentren, hier im Bild jenes des Start-ups Cerebras im kalifornischen Santa Clara, verschlingen im Normalfall enorme Energiemengen. Mit innovativen Data-Mining-Methoden lässt sich dieser Aufwand begrenzen. Dennoch fehlt es Fachleuten zufolge in Österreich an Rechenkapazitäten, was dazu führt, dass viele Forschungsfragen nicht behandelbar sind.
Rebecca Lewington/Cerebras Systems/Handout via REUTERS

"Im Grunde funktionieren Komprimierungsprogramme deshalb, weil es nicht nur zufällige Muster in den Daten gibt, sondern auch Regelmäßigkeiten", veranschaulicht Plant. "Wir verwenden denselben informationstheoretischen Ansatz, um – weitgehend frei von vorgegebenen Parametern – mehr über diese Muster zu erfahren. Die Komprimierbarkeit wird für uns zum Maß der Qualität der Datenmuster." Ein Anwendungsbereich der Methode sind Clustering-Algorithmen, die als Vorstufe oder Validierung von Machine-Learning-Methoden angewandt werden können. Dabei teilt das System Daten in Kategorien ein, die es selbstständig findet.

Vielfältige Anwendungsmöglichkeiten

Plant und ihre Kollegin Yllka Velaj nutzen das Prinzip etwa auch in einem Forschungsvorhaben, das gemeinsam mit dem Energieversorger Verbund umgesetzt wird. In dem Projekt, das von der Förderagentur FFG mit Mitteln des Klimaschutzministeriums unterstützt wird, suchen sie nach Clustern in Daten von Smart Metern, die engmaschig Verbrauchs- und Einspeisungsdaten bei Stromkunden aufzeichnen. "In den Nutzerdaten bilden sich verschiedene Gruppen ab. Das könnten Verwender einer Wärmepumpe sein, Home-Office-Nutzer oder Berufstätige, die vor und nach der Arbeit zu Hause Stromspitzen produzieren", gibt Plant Beispiele. "Die so gefundenen Gruppen können verwendet werden, um Netzkapazitäten besser zu steuern oder Nutzern personalisierte Angebote zu unterbreiten."

Wie groß die Bandbreite möglicher Anwendungen ist, zeigt ein Pionierprojekt in der Archäologie gemeinsam mit der Österreichischen Akademie der Wissenschaften (ÖAW). Hier wandte man das Clustering auf Fundorte von Glasperlen an, die im Mittelalter eine beliebte Grabbeigabe waren und eine große Farb-, Größen- und Mustervielfalt aufweisen. "Unser Ansatz ergab ein eigenes Klassifizierungssystem der Glasperlen, das Erscheinungsbild und Fundort zusammenbrachte", sagt Plant. "Merkmal der Wiener Gräberfelder sind übrigens Häufungen von gelben und schwarzen Perlen."

Neben der Suche nach innovativen Data-Mining-Methoden haben die Projekte aus Plants Gruppe noch eine weitere große Gemeinsamkeit: Sie sind so ausgewählt, dass der Rechenaufwand überschaubar bleibt – ein Fokus, dem auch eine Kritik an den verfügbaren Ressourcen in Österreich innewohnt. Plant: "Viele Fragestellungen rund um große und rechenintensive KI-Modelle können wir mangels Kapazitäten kaum bearbeiten. Sie werden damit letztendlich den großen KI-Konzernen in den USA und China überlassen." (Alois Pumhösel, 12.6.2024)