Den Menschen entschlüsseln

Ein Informatiker unter Biologen: was Big Data mit der Krebsforschung zu tun hat.

Den Menschen entschlüsseln
DNA-58Sequenz. Bild: All Mauritius Images / Science Photo Library.

Leben zu retten, braucht es manchmal auch einen Computer. Wir sitzen in Basel unweit der Messe in einem nüchternen Zimmer mit Linoleumboden. Es gibt in diesem Gebäude hunderte solcher Räume, angeordnet entlang schmaler Gänge. Junge Frauen und Männer aus allen Ecken der Welt, ohne oder mit Make-up, Kopftuch, Laborkittel, eilen freundlich lächelnd vorbei. Dieser Campus hier ist ein typischer Ort der sogenannten A-Schweiz, ein internationaler Forschungsbrennpunkt, eine der wichtigsten Brutstätten für potentielles Wirtschaftswachstum im Land.

Ein Computer also. Thomas Thurnherr, Forscher in der Abteilung für Computational Biology an der ETH, hat den Rechner mitgebracht ins Besprechungszimmer. Auf unsere Anfrage hin hat sich Thurnherr bereit erklärt, uns seine Arbeit zu erklären. Draussen scheint fast zum ersten Mal in diesem Jahr die Frühlingssonne, aber das macht nichts – wir haben eine sehr spannende Reise vor uns.

Herr Thurnherr, Sie sind Informatiker, andere in Ihrem Team Mathematiker oder Statistiker. Sie arbeiten in der Genforschung. Was haben Sie mit Biologie zu tun?

Bei der Analyse menschlicher DNA hat man es letztlich mit einer riesigen Menge an Informationen zu tun. Mit Daten. Um daraus sinnvolle Erkenntnisse zu gewinnen, braucht es Computerprogramme. Das ist unsere Expertise: wir suchen nach Mustern im Gencode. Wir nehmen beispielsweise die Gensequenz von gesunden Menschen und die von erkrankten und analysieren, wie sich die beiden unterscheiden.

Wie wird DNA, also menschliche Zellen, zu Daten?

Sie wird aus einer Zelle entnommen, beispielsweise aus der Gewebeprobe eines Krebspatienten, in Sequenzen gestückelt, gereinigt und in hochspezialisierte Geräte gegeben. Diese Geräte nutzen unterschiedliche biochemische Methoden, um die DNA einzulesen. Vereinfacht gesagt untersuchen sie mit Hilfe von fluoreszierenden Farbstoffen, wie stark eine Sequenz auf eine bestimmte Substanz reagiert. Daraus lässt sich ableiten, wie hoch die Konzentration eines bestimmten Bausteins an dieser Stelle ist. Das ist also letztlich eine Zahl. Mit diesem Teil der Arbeit hat unser Team kaum zu tun. Wir bekommen die Informationen zu den Bausteinen und arbeiten damit.

Sie haben es bereits gesagt: Sie suchen nach Mustern. Können Sie das genauer erklären? Sie persönlich haben beispielsweise mit den Daten von Leberkrebspatienten gearbeitet.

Genau. Da hatten wir Messungen zu Produkten von Genen, sogenannten RNA, von gesunden und kranken Gewebeproben von 100 an Leberkrebs erkrankten Patienten. Also 200 Proben. Der Mensch hat etwa 30 000 Gene, das ist also die Anzahl von Variablen, die es zu untersuchen gibt. Das ergibt gewisse statistische Herausforderungen.

Das kann man sich vorstellen.

Jedenfalls haben wir diese Daten untersucht und festgestellt, wo die Daten des erkrankten Gewebes von denen des nicht erkrankten abweichen. All diese Menschen sind an Leberkrebs erkrankt, sie haben aber, wie wir gesehen haben, unterschiedliche genetische Auffälligkeiten. Eigentlich brauchen sie also verschiedene Diagnosen und allenfalls auch verschiedene Behandlungen. Solche Erkenntnisse gewinnt man im Moment laufend für mehr Krankheiten. Bei Brustkrebs etwa ist man schon weiter, da man bei den Patienten klar definierte Subgruppen mit spezifischen genetischen Merkmalen identifiziert hat.

Sie verhelfen der Medizin zu präziseren Diagnosen?

Langfristig und im besten Fall, ja. Vieles, was wir tun, ist Grundlagenforschung. Wir arbeiten grundsätzlich an mathematischen Modellen, wie man die Daten auf bestimmte Fragen hin analysieren kann. Wir arbeiten an entsprechender Software mit. Das ganze Feld wächst weltweit gerade sehr stark, da gibt es laufend Anpassungen.

Sie entwickeln Algorithmen, die den Computer das Material auf ganz bestimmte Fragen hin untersuchen lassen? Kann man das so sagen?

Genau. Man ruft ein Merkmal nach dem andern ab.

Das ist eigentlich klassische Informatikarbeit. Sie könnten mit denselben Methoden beispielsweise den Verkehrsfluss in einer Grossstadt auf Muster hin untersuchen.

Das ist so, ja.

Verstehen Sie und die Biologen sich eigentlich gegenseitig?

(lacht) Wir verstehen uns sehr gut. Es ist relativ neu, dass es Studiengänge…