Stipendiaten 2008

Ferdinand Hofherr

Ferdinand Hofherr

Ferdinand Hofherr

Projekttitel: Entwicklung und Implementierung von "breakpoint detection" zur Analyse von "Single Nucleotid Polymorphismus"
Hochschule: Universität Ulm
Studiengang: Informatik


Kurzbeschreibung

Single Nukleotid Polymorphismen (SNP) sind Veränderungen einzelner Basen einer DNA Sequenz. Mit sogenannten SNP Microarrays können nun einerseits einzelne dieser Veränderungen untersucht werden andererseits kann überprüft werden, ob größere Bereiche des Genoms verändert sind. Diese Verfeinerungen der Matrix-/Array CGH Technik wird häufig dazu verwendet um diese Bereiche zu identifizeren und deren mögliche Assoziation zu einem spezifischen Krankheitsbild, wie z.B. dem Pankreaskarzinom, zu untersuchen.

Im Rahmen dieser Microarray Experimente, wird hierzu die DNA der zu untersuchenden Gewebeprobe mit der DNA eines als normal angenommenen Gewebes verglichen. Überschreitet ein Teil der aus dem Vergleich erhaltenen Daten einen gewissen Schwellwert, so kann davon ausgegangen werden, dass die entsprechende Region, verglichen mit der „Normal-DNA“, häufiger vorhanden ist. Sollte umgekehrt ein anderer Schwellwert unterschritten werden, so kann davon ausgegangen werden, dass die entsprechende Region, wiederum im Vergleich zur „Normal-DNA“, seltener vorkommt.

Die von SNP Microarray Experimenten gelieferten Daten sind jedoch verrauscht, d.h. von Störgrößen verzerrt. Daher ist das finden von Schwellwerten, die nur solche Aberrationen identifizieren, die in der DNA auch tatsächlich vorhanden sind, äußerst schwierig. Mittels unterschiedlicher Methoden wird versucht aus den vorhandenen Daten solche Schwellwerte abzuleiten, die von diesen Störgrößen möglichst unbeeinflusst sind. Ein gewisser Resteinfluss des Rauschens auf den gefundenen Schwellwert verbleibt jedoch.

Verschiedene Schwellwertverfahren können für denselben Datensatz unterschiedliche Schwellwerte liefern. Durch Kombination mehrerer solcher Werte könnte es gelingen, den Einfluss des Rauschens weiter abzusenken.

In meinem Projekt möchte ich daher untersuchen, ob die Kombination mehrerer Schwellwertverfahren zu einem besseren Ergebnis führt, als dies bei Anwendung eines einzelnen Verfahrens der Fall wäre. Hierzu soll ein Schwellwertverfahren entwickelt werden, welches auf der Kombination mehrerer Einzelverfahren aufbaut. Die Güte des neuen Verfahrens soll durch einen empirischen Vergleich mit bereits existierenden Verfahren ermittelt werden. Als Implementierungssprache ist die freie Statistiksprache R vorgesehen. Das aus meinem Projekt resultierende Paket soll im Rahmen des Bioconductor Projektes frei zur Verfügung gestellt werden. Zudem ist eine Integration in die freie Java Software IdeogramBrowser geplant, die an der Universität Ulm entwickelt wurde.


MFG Stiftung
Wappen Baden-Württemberg