Archiv

Fallbeispiel: Data Mining für Public Health

Christina Class, Debora Weber-Wulff & Tobias Preuß

Andrea arbeitet in der Informatikabteilung einer großen Krankenkasse. Sie ist für die Datenanalyse zuständig und hat die Möglichkeit, neuere Methoden auszuprobieren. In den letzten Jahren hat sie sich häufiger mit Tom unterhalten, den sie immer wieder auf Konferenzen getroffen hat. Tom forscht seit Jahren erfolgreich im Bereich „Privacy Preserving Data Mining“ an Methoden, die die Privatsphäre von Personen schützen. Hierzu gehören ausgeklügelte Verfahren der Anonymisierung.

Die Krankenkasse, bei der Andrea arbeitet, beteiligt sich, wie auch viele andere Kassen, an einem von einer Stiftung finanzierten Projekt mit dem Namen „Public Health“. Dafür stellen verschiedene Krankenkassen und Unfallversicherungen Daten der letzten 30 Jahre zur Verfügung. Nach Abgleich und Aggregierung der personenbezogenen Informationen werden die Daten anonymisiert. Die Analyse der zahlreichen Daten aus drei Jahrzehnten soll einer verbesserten Abschätzung der Entwicklung der Anforderungen im Gesundheitsbereich dienen. Damit soll es möglich werden, die Ausbildungsplanung bei Ärzten und Pflegepersonal, die Spezialisierung sowie die Kapazitätenplanung in Krankenhäusern und Pflegeheimen zu verbessern. Somit soll ein wichtiger Beitrag zur Vorbereitung auf die alternde Gesellschaft geleistet werden. Tom hat für das Projekt ein Gutachten erstellt, in dem dargelegt wird, wie die auf die Daten angewendeten Anonymisierungverfahren ausreichen, um den Datenschutzrichtlinien gerecht zu werden.

Andrea ist von dem Projekt begeistert und lässt sich von Tom sein Gutachten geben. Doch sie wird nachdenklich, als sie eine Studie in einer wissenschaftlichen Zeitung liest. Diese zeigt auf, dass sich Daten, die mit den Methoden des Projekts anonymisiert wurden, zu 93% wieder personalisiert werden können. Sie gibt ihre eigenen Informationen (Geschlecht, Geburtsdatum und Postleitzahl) ein und wendet das im Artikel beschriebene Verfahren an. Sie schaut ungläubig auf ihre Krankengeschichte, diese ist (soweit sie sich erinnern kann) vollständig. Gut, ihr Fall ist vielleicht auch recht einfach. Sie war ihr Leben lang bei der gleichen Versicherung versichert, lebte in der gleichen Stadt und hat nie ihren Namen geändert. Um es mit etwas komplexeren Daten zu versuchen, gibt Andrea Geburtsdatum, Postleitzahl und Geschlecht ihrer Mutter ein. Durch zwei Ehen mit Namenswechseln, verschiedene Wohnorte, Arbeitsstellen und Krankenkassen, sollten die Daten ihrer Mutter nicht so einfach zu ermitteln sein. Doch dies ist eine trügerische Hoffnung. Die (Andreas Wissen nach) komplette Krankengeschichte ihrer Mutter wird erstellt, inklusive der zwei Kuren auf Norderney. Die Krankendaten reichen sogar 40 Jahre zurück, eine Kasse hat also mehr Informationen zur Verfügung gestellt. Plötzlich starrt Andrea ungläubig auf einen Eintrag aus dem Jahr 1975. Ihre Mutter hatte damals, 18 Jahre alt, einen gesunden Jungen entbunden, der wohl zur Adoption freigegeben wurde. Andrea ist schockiert. Dennoch kann sie diese Information sofort glauben, sie erklärt die heftige Reaktion ihrer Mutter, als ihre 21-jährige Cousine ein Kind zur Adoption freigab.

Andrea wird nachdenklich. Was soll sie tun? Das Projekt wird mit einer großen Summe gefördert und das Gesundheitsministerium ist ein Projektpartner. Das Thema ist von gesellschaftlicher Relevanz. Aber die Daten einzelner Personen können viel zu leicht extrahiert werden. Da sich sowohl ihr Chef als auch der Leiter des Gesamtprojekts positive Auswirkungen auf ihre Karriere ausrechnen, wird es schwer, diese von den Risiken zu überzeugen. Von Tom kann sie keine Hilfe erwarten. Sie überlegt eine Weile und stellt dann eine Krankenakte für ihren Chef und den Projektleiter zusammen. Sie hat ein komisches Gefühl, als sie sieht, dass ihr Chef jahrelang in Psychotherapie war und der Projektleiter alle paar Monate einen AIDS Test machen lässt. Aber was soll’s! Sie wird ihnen beim nächsten Projekttreffen ihre Akten vorlegen und sie dann hoffentlich dazu bewegen können, das Projekt zu stoppen.

Als sie nach Hause geht, kehren ihre Gedanken wieder zu ihrer Mutter zurück. Wie soll sie ihr gegenübertreten? Was soll sie mit dem Wissen tun? Vergessen kann sie es nicht so einfach, dass sie noch einen Halbbruder hat….

Fragen:

  • Hatte Andrea das Recht, nach den Daten ihrer Mutter zu suchen? Hätte sie sie vorher fragen sollen?
  • Ist es ein ethisches Problem, dass Andrea einfach davon ausgeht, dass Tom, ihr Chef und der Projektleiter ihren Bedenken kein Gehör schenken würden?
  • Durfte Andrea die Daten ihres Chefs und des Projektleiters herausziehen, um sie von den Problemen mit der Datenanonymisierung zu überzeugen?
  • Wird Andreas Herangehensweise von Erfolg gekrönt sein oder könnte die Offenlegung der privaten Krankengeschichte ihrer Vorgesetzen von diesen anders interpretiert werden?
  • Wie ist zu bewerten, dass mindestens eine beteiligte Krankenkasse Daten eines längeren Zeitraums für das Projekt zur Verfügung stellt?
  • Die alternde Gesellschaft wird uns vor einige Probleme stellen, auf die wir uns vorbereiten müssten. Ist das Risiko, dass Krankendaten wie im beschriebenen Fall eingesehen werden können, vertretbar, wenn es darum geht, die medizinische Infrastruktur der Zukunft zu planen? Ist die Annahme, dass unsere medizinischen Daten in der heutigen Zeit ausreichend geschützt sind, überhaupt noch zutreffend?
  • Sollten Personen, die im Rahmen von Datenanalyse mit (anonymisierten) medizinischen Daten in Kontakt kommen, der Vorsicht halber einfach zur Verschwiegenheit verpflichtet werden?

Wir freuen uns auf Ihre Kommentare!


Erschienen in Informatik-Spektrum 37 (1), 2014, S. 60-61

5 comments to Fallbeispiel: Data Mining für Public Health

  • Niklas der HS

    hey. richtig gut.
    weiter so =)

  • Gott, Petra, Ordo, Freak

    Gott: Totaler scheiss so was schlechtes habe ich noch nie erlebt. Die fragen kann ja ein drei Jähriger beantworten ohne das er denn Text gelesen haben muss

    Petra: Ich finde das gut was ihr macht. Aber die Geschichten haben nix mit den aufgaben zu tun, und man hätte das auch so lösen können.

    Ordo: Den Text braucht man für die Aufgaben nicht und die AUfgaben sind viel zu leicht. Auch die Geschichte mit dem Halbbruder interssirt keinen. Man hätte denn Text interessanter machen sollen und die Aufgaben wesntlich schwerer!

    Freak: Die Fragen sind oft nicht durchdacht und wirken stark pseudo Ethisch.

    • stefan

      Danke für den Hinweis. Ich habe mir einmal erlaubt, die Kommentare von Gott, Petra, Ordo und Freak zu einem Kommentar zusammenzufassen, weil sie sich nicht nur inhaltlich sehr ähneln.

      @Gott: Ich muss dir zustimmen, auch Dreijährige zeigen bereits ein Verhalten, das wir als moralische Motivation deuten könnten, wie die Langzeituntersuchungen von Michael Tomasello gezeigt haben. Freilich können sie sich noch nicht gut ausdrücken, insofern müssen wir immer sehr wohlwollend annehmen, dass sie die Fragen auch verstanden haben.

      @Petra: Die Geschichten sind ja ausformulierte Gewissensbisse, damit die Antworten doch nicht so klar ausfallen, wie man das ohne Geschichte erwarten würde.

      @Ordo: Mit dem Schwierigkeitsgrad bei moralischen Fragen ist das so eine Sache. Mir erscheinen Dinge oft ganz klar, dann blicke ich in die Tageszeitung und sehe, dass es viele konkurrierende Meinungen dazu gibt.

      @Freak: Die Fragen sind zumeist nicht ethischer, sondern moralischer Natur. Da jedoch keine bewusste Täuschung vorliegt, würde ich das »pseudo« zurückweisen wollen.

  • […] stefan bei Fallbeispiel: Data Mining für Public Health […]

  • […] 2014 – Fallbeispiel: Die üblichen Verdächtigen, C. Kurz / S. Ulrich und Fallbeispiel: Data Mining für Public Health, C. Class / D. […]

Leave a Reply to Niklas der HS Cancel reply

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>