PERISKOPINION Leader

Je mehr Zahlen, desto mehr Herz

Von Mag. Fabian Frühstück, Bakk. phil. | Februar 2016 | Periskop Ausgabe 67

Der Big Data-Experte Prof. Dr. Reinhard Riedl hat sich mit Univ.-Prof. Dr. Christian Singer getroffen,
um einen offenen Dialog über die Bedeutung von Big Data in der praktischen Medizin zu führen.
Große Datenmengen, deren Analyse und Anwendung erlangt in der angewandten Medizin einen immer
höheren Stellenwert. Damit es bei der Suche nach Ursachen und Lösungen jedoch nicht zu einem
„Fischen im Trüben“ kommt, ist die Zusammenarbeit von Experten verschiedener Sparten wichtiger
denn je. In diesem Zusammenhang darf auch die soziale Komponente nicht vergessen werden, die
eine Zusammenarbeit domänenübergreifend erleichtert.

CS (Univ.-Prof. Dr. Christian Singer) Gerade im Feld der Molekularbiologie und der Genetik werden wir zum Teil von einer Vielzahl von mehr oder weniger relevanten Daten geradezu überschüttet. Oft haben klinisch tätige Ärzte dann aber nicht die speziell dafür notwendige Expertise und Ausbildung, um diese Informationen richtig auszuwerten. Aus diesem Grund kommen dann sinnhafterweise Biomathematiker ins Spiel, die Rohdaten durch Reduktion und therapierelevante Algorithmen in eine klinisch interpretierbare Form bringen.

RR (Prof. Dr. Reinhard Riedl) Welche Fragen aus der Medizin erhofft man sich generell durch Big Data beantworten zu lassen?

CS Das Stichwort – oder besser das Motto – lautet „personalisierte Medizin“. In diese Richtung soll und muss sich die Medizin entwickeln, um einerseits eine auf die Patientin bzw. den Patienten zugeschnittene effektive und möglichst nebenwirkungsarme Behandlungsoption anbieten zu können und andererseits auch den ökonomischen Limitierungen unseres Gesundheitssystems gerecht zu werden. Es ist beispielsweise extrem wichtig, dass man mehr über die genomische Charakteristik eines Tumors herausfindet, um nur jene „Veränderungen“ therapeutisch zu avisieren, die auch tatsächlich eine krankheitsrelevante Bedeutung haben. Heute können wir nicht nur eine Vielzahl an Genen, sondern auch epigenetische Alterationen und Metabolomsignaturen rasch analysieren, das wäre vor zehn Jahren in dieser Quantität undenkbar gewesen. Natürlich ist bei so viel Information auch viel „Trash“ dabei, also Muster ohne klinische Relevanz. Dennoch gelingt es uns zunehmend besser, eben durch den Einsatz von großen Datenmengen in Verbindung mit klinischem Outcome eine Art Signatur- Set zu identifizieren. Prognostisch gesehen sind Gensignaturen und epigenetische Daten, welche durch Big Data gewonnen werden, von zunehmender Bedeutung. Die derzeit eingesetzten und bereits kommerziell verfügbaren Algorithmen sind erst ein kleiner Einblick in das, was da in den nächsten Jahren auf uns zukommt. Leider fehlen uns oft noch die richtigen Werkzeuge, auch wenn wir eine potenziell interessante Information haben. Aber wir beginnen zu verstehen, dass Tumore oft außerordentlich heterogen sind und wir Subgruppen, die wir vorher schwer unterscheiden konnten, jetzt mithilfe der Daten in kleinere, zunehmend therapierelevante Subgruppen gliedern können. So kann Krebs in Zukunft nachhaltiger und effektiver behandelt werden.

RR Nach meiner Idee von personalisierter Therapie werden dafür die Therapieerfahrungen mit Patienten mit der gleichen Diagnose und ähnlichem Genom herangezogen, um abschätzen zu können, welche Therapien die größten Erfolgschancen bieten. Kann man sich das in etwa so vorstellen?

CS Das ist ein gutes Beispiel. Man kann diese Überlegung noch weiter strecken, für den Bereich des Brustkrebses beispielsweise. Wenn wir uns hier die evolutionsspezifischen Unterschiede der Menschen genauer anschauen, können wir dann durch die gewonnenen Daten der Pharmakokinetik Informationen über die europäische Frau auf asiatische Frauen anwenden? Warum wirken manche Stoffe bei gewissen Populationen und warum bei anderen nicht? Warum treten bei manchen Frauen bestimmte Nebenwirkungen auf und bei anderen nicht? In diesem Bereich kann noch viel geforscht werden.

RR Wenn wir uns diese Visionen vor Augen halten, von welchem Zeithorizont sprechen wir dann?

CS Wir haben den Fuß in der Tür. Ich denke, jetzt ist es wichtig, Signaturen, die auf Big Data basieren, tatsächlich breit einzusetzen. Ich glaube, dass es in zehn Jahren selbstverständlich sein wird, einen Tumor komplett zu sequenzieren und sein Metabolom zu charakterisieren. Und dieses Wissen, gepaart mit einer leistungsfähigen Bioinformatik, wird uns helfen, die jeweilige Achillesferse des Krebses zu beschreiben – und hoffentlich auch zu behandeln.

RR Spielt sich dieser angestrebte Fortschritt nur auf der Ebene des Genoms oder des menschlichen Metabolismus ab oder können auch Daten über den persönlichen Lebensstil in Zukunft genutzt werden?

CS Hinweg über alle genomischen Analysen kann klar gesagt werden, dass Menschen, die nicht rauchen, sich gesund ernähren und Sport treiben, einen besseren Outcome vorweisen. Das ist einfach so, und das wissen wir auch ohne Big Data. Guter Lebensstil, guter Outcome. Aber Lebensstil reflektiert sich eben auch im Metabolom und die Zuordnung vom Lebensstil zum Organismus ist deutlich komplexer. Ethnische, sozioökonomische, genetische und andere Lifestylefaktoren lassen sich oft nur schwer beschreiben und ineinander übergehende Gruppen brauchen große Datenmengen. Also wieder eine Domäne von Big Data. Die Analysen sind hier allerdings um einiges aufwändiger, weil die Untersuchungen und Datensätze einfach um so vieles komplexer sind.

Nur wenn diese Institutionen auf Augenhöhe arbeiten, kann maximaler Output generiert werden

RR Big Data ist auch ein weites Feld. Ich nenne beispielsweise die Spielform des explorativen Data Minings immer ein „Fischen im Trüben“, weil man nach Mustern sucht, deren Gestalt unbekannt ist. Selbst wenn die gefunden werden, werden sie oft nicht verstanden. Oder aber es werden Muster gesehen, die es so gar nicht gibt. Es gibt zwar einige interessante neue Technologien wie Linked Data. Die helfen, aber gerade bei den besonders vielversprechenden Werkzeugen haben wir noch nicht genügend Maturität erreicht, um sie in der Praxis effizient einsetzen zu können. Dazu kommt, dass oft schlicht nicht genügend Daten vorhanden sind, um Big-Data-Methoden anzuwenden. Es ist eine Illusion, dass man in der Praxis aus dem Vollen schöpfen kann.

CS Das ist so. Gerade wenn wir in Abwesenheit von validen Hypothesen Data Mining betreiben, wenden wir oft einen Bottom- up-Ansatz an, bei dem vergleichbare genomische Muster gemeinsam clustern. Die Technik birgt inhärent die Gefahr eines Überangleichens von gewonnenen Daten in sich. Um die Alltagstauglichkeit einer Signatur zu testen, muss diese daher in einem unabhängigen Kollektiv validiert werden. Dafür braucht man wieder Daten von weiteren Individuen. Und wer sagt mir, dass beispielsweise ein Genmuster, das bei asiatischen Männern erhoben wurde, auch bei südamerikanischen Frauen hilfreich ist? BRCA 1 und 2 haben uns gelehrt, eine holistischere Sichtweise einzunehmen: Das BRCA-Polymorphismenbild von Betroffenen erlaubt uns bereits jetzt eine grobe geografische Zuordnung, und das bei gerade einmal zwei untersuchten Genen. Um genomische Muster in großem Maßstab generieren zu können, braucht es einfach eine unglaublich hohe Zahl von Daten, aber auch oft eine unglaublich hohe Zahl von untersuchten Menschen. Uns fehlt derzeit einfach das Geld, um Big Data besser einsetzen zu können. Und ich vermag auch nicht zu erkennen, dass sich daran in Österreich in nächster Zeit viel verändern wird. Andere Länder sind da deutlich weiter. Big Data bedeutet „Big Money“. Analysen werden zwar immer billiger und einfacher, aber die Breite und die Vergleichbarkeit fehlen uns. Außerdem haben wir oft mit sehr individuellen personalisierten Verhältnissen zu tun. Es gibt sehr seltene Tumore. In Österreich gibt es hier wenig oder keine zu vergleichenden Patienten. Ein wichtiger Schritt wäre es, international Datenbanken zur Verfügung zu stellen und auch zu vernetzen, um auf Rohdaten zugreifen zu können.

RR Grundsätzlich sind also die Daten, die in den USA, Europa oder in Österreich erhoben werden, kompatibel, so dass man sie mit einer internationalen Datenbank gut zusammenführen könnte?

CS Wenn Daten zugänglich, anonymisiert oder pseudoanonymisiert zur Verfügung gestellt werden würden, wären sie auf der Ebene der Sequenzierung und der Epigenetik durchaus vergleichbar. Viel von dem, was wir über den erblichen Brust- und Eierstockkrebs wissen, wurde durch das Einbringen in große multinationale wissenschaftliche Konsortialstudiengruppen generiert. So kann man sich auf bereits erhobene Daten stützen und diese in Vergleichsanalysen einbinden. Pharmafirmen machen das in großem Stil schon länger so, wenn es um die Entwicklungen von Medikamenten geht. Diese Unternehmen wollen nicht nur in Asien ein bestimmtes Produkt verkaufen, sondern natürlich auch in Amerika oder in Europa. Daher muss bereits früh feststehen, ob beispielsweise die Pharmakokinetik – etwa bei Personen unterschiedlichen Alters oder unterschiedlicher Rasse – vergleichbar ist. Bei der Krebsforschung haben wir zum Beispiel evolutionäre Unterschiede lange außer Acht gelassen. Heute wissen wir, dass Krebsformen, die beispielsweise bei Japanern häufig auftreten, bei uns kaum relevant sind und umgekehrt. Der persönliche Lebensstil eines Menschen, aber auch die Einflüsse aus der jeweiligen Umwelt spielen selbstverständlich auch immer eine große Rolle.

RR Die evolutionsspezifischen Unterschiede sind selbstverständlich von großer Bedeutung. Sie haben den Lebensstil als Faktor genannt. Inwiefern spielt der persönliche Lebensstil eine Rolle in der Krebsforschung?

CS Der Lebensstil ist durchaus von großer Relevanz! Wir haben kürzlich eine Studie veröffentlicht, die zeigt, dass Frauen mit BRCA- Keimbahnmutationen, die nach 1965 geboren sind, häufiger rauchen, später Kinder bekommen und öfter übergewichtig sind, im Vergleich zu Frauen, die vor 1965 zur Welt kamen. Das sind Risikofaktoren für Brustkrebs. Die untersuchten Frauen aus der Gruppe der nach 1965 geborenen Frauen erkrankten bis zu acht Jahre früher. Das macht der Lebensstil aus. Das ist, was die Umwelt mit uns macht und wir mit unserer Umwelt.

RR Wäre in diesem Zusammenhang nicht auch eine individualisierbare, personifizierte Aufklärung von großer Bedeutung? Wenn jemand beispielsweise wüsste, dass durch die genetischen Voraussetzungen die Gefährdung durch eine bestimmte Krebsform besteht, dann wäre die Anleitung zu oder besser die Warnung vor einem gewissen Lebensstil sehr relevant.

CS Natürlich. In großen Kohortenstudien ist das ein wichtiger Aspekt. Im Bereich von Krankheitsvorsorge ist Big Data von potenziell enormer Wichtigkeit. Speziell wenn es um Details, um sehr kleine Unterschiede geht, dann werden diese erst durch große Datenmengen erkennbar. Das Dilemma daran – wie generell bei Big Data – ist, dass wir viel an Informationen haben, die uns keinen großen klinischen Nutzen bringen. Was bringt mir beispielsweise die Information, dass ich ein um 1,17-fach erhöhtes Risiko habe, an multipler Sklerose zu erkranken? Die Frage nach der Relevanz bei diesen Mengen an Daten ist ohne kompetente Aufarbeitung sehr schwierig.

RR Gibt es denn bereits Ausbildungen, die Forscher in der Medizin auf Big Data vorbereiten, damit die Thematik in Zukunft besser verstanden und umgesetzt werden kann?

CS Es gibt eigene Lehrstühle und Ausbildungen für Biomathematiker. Wir in der Klinik haben leider sehr wenig Erfahrung mit dieser Materie. Man kann behaupten, dass durch die unglaublich raschen Entwicklungen in der molekularen Medizin eine große Lücke zur Klinik entstanden ist. In der Vergangenheit wurden Elemente, die in der Vorklinik behandelt wurden, auch in der Klinik umgesetzt. Heute ist das nicht mehr möglich. Translationale Forschung bedeutet, diese Aspekte der vorklinischen Ideen mit dem „medical need“ der Klinik zu verbinden und anzuwenden. Dazu muss man jedoch beide Seiten kennen. Für einen Kliniker hört sich Big Data vielleicht kompliziert und abschreckend an. Es müssten zuerst die vielen Möglichkeiten aufgezeigt werden. Der Vorkliniker hat diese Informationen und kennt die Möglichkeiten, weiß aber nicht, wie er sie einsetzen soll. Hier muss Kommunikation stattfinden. Eine Lösung wäre ein Tutorenprogramm für Kliniker und Vorkliniker, um eben diesen Informations-Gap zu schließen.

RR Gibt es institutionelle Lösungen, die bereits umgesetzt werden, um diese Wissenslücken zu schließen?

CS Ja, in unserer Klinik werden PhD-Studiengänge eingeführt. Da wird es einem Mediziner ermöglicht, sich ein Jahr lang mit der Vorklinik auseinanderzusetzen. Er darf in dieser Zeit nicht klinisch arbeiten. So kann er diese Seite kennenlernen. Und diesen Weg so zu gehen ist ganz spannend. Ein PhD-Programm in translationeller Medizin oder in Bioinformatik ist meiner Meinung nach ein sehr guter Ansatz in die richtige Richtung.

RR Wird dort dann auch hands-on mit Big Data gearbeitet? Wie kann man sich die Praxis vorstellen?

CS In der Praxis wünscht man sich ein Tool, in das das Blut „hineingeschüttet“ wird. Und unten soll ein fertiges Kochrezept für die Behandlung herauskommen. In Wirklichkeit erhält man einen Ausdruck mit sehr vielen Daten und Zahlen. Es übersteigt dann häufig die Kompetenz eines Klinikers, diese zu analysieren und für klinische Zwecke umzusetzen. Als klassisch ausgebildetem Molekularbiologen fehlt einem dafür wieder das klinische Know-how. In der Praxis wird das Ergebnis einem Biomathematiker gezeigt. Nur die Trias Molekularbiologe, Biomathematiker und Kliniker bringt den Erfolg. Und das wird in Österreich nur von einer Handvoll von universitären Instituten praktiziert.

RR Der Biomathematiker ist also in dieses Team integriert?

CS Ja, das Problem liegt hier auch wieder in der Kommunikation und der Fachspezifität. Wir sprechen nicht die gleiche Sprache. Deswegen müsste man eine Spezialisierung fordern, aber auch dass beispielsweise der Biomathematiker einen klinischen Zugang zum Thema hat. Und dann gibt es einen weiteren Grund, warum Biomathematiker selten in der medizinischen Forschung anzutreffen sind: Es gibt einfach zu wenige mit einer entsprechenden Ausbildung. Und universitäre Forschung zahlt auch weniger als die Privatwirtschaft.

RR Sie sprechen das Thema „Domänenwissen für Mathematiker“ an. Meiner Meinung nach wäre es viel effektiver, wenn man beispielsweise einem Mediziner mathematisches und technisches „Werkzeugwissen“ beibringen könnte. Ich finde, hier wird oft nur in eine Richtung weitergebildet.

CS Das ist sicher ein guter Punkt. Ich glaube aber, dass die Biomathematik und die Analyse daraus so komplex geworden sind, dass ich nicht weiß, ob man das einem Humangenetiker oder einem onkologisch tätigen Facharzt zumuten könnte. Hier spielt eben wieder das Kommunikationsproblem eine entscheidende Rolle. Und da sind wir noch nicht einmal in der Klinik angekommen. Diese Kreise sollte man schließen und zusammenführen. Man muss von einem Biomathematiker verlangen können, sich mit einer Thematik auseinanderzusetzen, um dann lösungsorientierter an einem Problem mitzuarbeiten. Das Gegengleiche gilt natürlich auch für den Kliniker. Sonst kann dies schnell zu einer Einbahnstraße werden.

RR Was Sie hier skizzieren, ist eines der großen klassischen Probleme der Informatik an sich. Informatik sollte eigentlich ein „Enabler“ für die Anwender werden. Wenn man jedoch nicht weiß, was technisch alles möglich ist, kommt man nicht weiter. Es sollte also auf Augenhöhe zusammengearbeitet werden. Biomathematiker, Informatiker und Domänenspezialisten aus der Klinik beispielsweise. Nur wenn diese Institutionen auf Augenhöhe arbeiten, kann maximaler Output generiert werden. Sobald man die Sprache des anderen spricht, wird die Beziehung wesentlich besser. Denken Sie, dass Big Data jemals in der Arbeit eines niedergelassenen Arztes eine Rolle spielen wird oder reden wir hier nur von Spezialisten in einem Krankenhaus?

CS Am Ende des Tages werden der Arzt und vor allem der Patient davon profitieren. Aufgrund der Komplexität und der persönlichen Weiterbildung im eigenen Fachbereich wird dieser Prozess jedoch noch dauern. Wenn man sich den schnellen Wandel und die Menge an laufend neuer Literatur in der Medizin ansieht, ist der Arzt in seiner Domäne bereits immer auf Weiterbildung. Da noch einen „Sidestep“ zu machen wird zunehmend schwierig. Ich sehe hier nicht die Aufgabe beim einzelnen Kliniker, eher auf der Ebene der Universitäten im Blick auf die Zukunft. Die moderne Forschung benötigt nicht nur Spezialisten in einem kleinen Bereich, auch soziale Skills gewinnen mehr und mehr an Bedeutung.

RR Zusammenfassend können wir also festhalten, dass durch Big Data die Komplexität stark wächst und deshalb die interdisziplinäre Zusammenarbeit sehr an Bedeutung gewinnt. Die soziale Fähigkeit zur interdisziplinären Vernetzung wird zu einem entscheidenden Faktor für die erfolgreiche Nutzung von Big Data.

Univ.-Prof. Dr. Christian Singer studierte Medizin an der Universität Innsbruck und der Universität Wien. Anschließend folgte ein Studium der Gesundheitswissenschaften an der Harvard Universität in Boston. 2003 schloss Dr. Singer die Facharztausbild ab, welche er an den Universitäten Wien und München absolvierte. Mehrjährige Forschungsaufenthalte an der Universität Löwen (Belgien) und an der Georgetown University folgten, vor der Habilitation im Jahr 2002. Derzeit arbeitet Univ. Prof. Dr. Christian Singer als Leiter der Ambulanz für Erblichen Brust- und Eierstockkrebs am AKH Wien.

Prof. Dr. Reinhard Riedl studierte Technik an der Johannes Kepler Universität Linz und promovierte in Mathematik an der Universität Zürich. 2001 bis 2002 hatte er eine Vertretungsprofessur für Hochleistungsrechnen an der Universität Rostock inne. 2002 bis 2004 vertrat er den Lehrstuhl Kommunikation und Verteilte Systeme am Institut für Informatik der Universität Zürich und 2004 bis 2006 leitete Prof. Dr. Reinhard Riedl die E-Government Forschungsgruppe ebendort. Von 2006 bis 2014 leitet er die Forschung im Fachbereich Wirtschaft und das E-Government Institut der Berner Fachhochschule (BFH). Seit 2014 ist er wissenschaftlicher Leiter des Fachbereichs Wirtschaft.

Den vollständigen Artikel finden Sie auf der rechten Seite zum Download.