Stipendiaten 2011

Florian Schmid

Florian Schmid

Projekttitel: Transduktive Lernverfahren zur Analyse molekularmedizinischer Daten
Hochschule:
Universität Ulm
Studiengang: Informatik (Master)

Transduktive Lernverfahren zur Analyse molekularmedizinischer Daten

In Wirtschaft, Technik und Medizin werden immer mehr Daten erfasst. Die Kategorisierung (Klassifikation) dieser Daten ist ein nicht zu unterschätzendes Problem, das auch für moderne Computersysteme eine Herausforderung darstellt.

Hierfür werden Algorithmen eingesetzt, die Klassifikationsvorschriften erstellen, welche eine einfache Einordnung neuer Daten erlauben. Im einfachsten Fall erhält ein solcher Algorithmus bereits klassifizierte Beispiele (induktives Lernen). Auch Karl Steinbuch entwickelte mit seiner Lernmatrix bereits ein induktives Lernverfahren (1).

Ein Nachteil des induktiven Lernens ist, dass eventuell vorhandene Daten ohne Einordnung in eine Klasse vernachlässigt werden, obwohl auch diese Informationen verwendet werden könnten.

In Forschungsfeldern in denen nur sehr wenige Beispiele erzeugt werden können, kann diese Einschränkung negative Auswirkungen haben. Zu ihnen zählt die molekulare Medizin. Hier werden hochdimensionale Genexpressionsprofile von Patienten klassifiziert und in verschiedene Tumorklassen eingeteilt. Ein typischer Datensatz besteht hier aus etwa 100 Datenpunkten und enthält mehrere tausend Genexpressionen.

In meinem Projekt sollen für diesen Bereich Lernverfahren erforscht werden, die auch nicht klassifizierte Beispiele einbeziehen und aus diesen Informationen gewinnen können (transduktives Lernen).

 

(1) Karl Steinbuch: Automat und Mensch. Kybernetische Tatsachen und Hypothesen. Springer, Berlin/Heidelberg/New York 1961, 1969, 3. Aufl.