Archiv

Fallbeispiel: Zusammenwachsen

Constanze Kurz & Rainer Rehak

Angus hat einen Bachelor in Mathematik und anschließend an einer anderen Hochschule einen Informatik-Master abgeschlossen.

Nach einiger Suche hat er an einer renommierten Universität eine drittmittel-finanzierte Doktorandenstelle gefunden, die in Kooperation mit einem großen Datenverarbeiter im Bereich Data-Mining ausgeschrieben war. Gerade Datenbanken und die Theorie dahinter hatten es ihm im Studium angetan. Insbesondere die Verknüpfung von Elementen in heterogenen Datenbanken ohne Fremdschlüssel wurden zu seinem Spezialgebiet. In seiner neuen Stelle würde es sicherlich interessant werden, seine Ideen und Implementierungen mit praktischen Daten und umfangreichen Datenmengen auf tatsächlich in derWirtschaft genutzten leistungsfähigen Großrechnern zu testen.

Physical Virtual Infrastructure - CC BY-NC-ND delbz

Physical Virtual Infrastructure – CC BY-NC-ND delbz

Die DeepKnowl AG (DKAG), der Datenverarbeiter, mit dem Angus zusammen an seinen Projekten arbeitet, speichert für Dritte Daten und sucht bei Bedarf darin auch nach Mustern oder Abhängigkeiten. Kunden der DKAG sind vornehmlich große Restaurantketten, Krankenkassen, internationale Reiseveranstalter und Mobilfunkkonzerne. Die Reputation der Firma ist tadellos, sie hat sich einen Namen damit gemacht, niemals Daten zu ,,verlieren“; ganz im Gegensatz zu manchen Konkurrenten, die zuletzt wiederholt mit Sicherheitslücken zu kämpfen hatten. Die DKAG betreibt auch eigene Rechenzentren, wo Angus nun seine Experimente auf Kundendaten durchführen kann.

Er arbeitet gerade an einem neuen Verfahren, große Datenmengen aus verschiedenen Quellen zu verketten, deren Verknüpfung in der Struktur der Daten nicht vorgesehen war und daher als recht schwierig gilt. Für seine aktuelle Methode nutzt er sehr rechenintensive statistische Verfahren, die mit den einfach strukturierten Testdaten in der Uni erstaunlich gut funktionierten. Angus nimmt nun an, dass seine Methode der Verkettung auch für echte und damit unstrukturiertere Daten gut funktionieren sollte. Jetzt möchte er diese Methode mit den Daten testen, die der Projektpartner von der DKAG ihm am nächsten Tag zugänglich machen wird.

Am Abend schaut Angus wie üblich die Nachrichten, da fällt ihm eine Meldung besonders auf. Die große und recht bekannte Firma ,,MediData GmbH“, die Krankenversicherungsdaten verarbeitet, ist überraschend in Konkurs gegangen.

Viele Arbeitsplätze sind nun bedroht. Im Bericht kommen Gewerkschaftsvertreter zu Wort, die Managementfehler anführen und Konsequenzen für die verschiedenen Standorte und Insolvenzpläne kommentieren. Eventuell gäbe es aber eine letzte Möglichkeit, all die Arbeitsplätze noch zu retten, da sich ein noch unbekannter Investor interessiert gezeigt hätte. Es soll ein Konkurrent sein, die Verhandlungen dauerten jedoch noch an.

Am nächsten Tag fährt Angus, wie so oft in den letzten Tagen, zu der DKAG-Zweigstelle, wo sich sein temporärer Arbeitsplatz befindet.

Die Projektverantwortliche der DKAG begrüßt ihn freundlich und merkt kurz an, dass er mit seinem Datenbank-Login ab heute Zugriff auf die versprochenen neuen Daten hätte und nun zeigen könne, wozu seine Verknüpfungs-Implementation in der Praxis fähig wäre. Die neuen Daten sollten testweise mit einer großen DKAG-eigenen, verteilten Datenbank verkettet werden.

Als er die riesige Datenbank initial inspiziert, merkt Angus, dass es sich um elektronische Gesundheitsdaten handelt. Es tritt ihm kalter Schweiß auf die Stirn als ihm klar wird, dass er mit den Daten der insolventen Firma MediData arbeitet und wovon es abhängen wird, ob der ,,unbekannte Investor“ die MediData GmbH retten würde.

Fragen

  1. Ist es sinnvoll, neue Informatikmethoden von Universitäten direkt mit tatsächlichen Daten in der freien Wirtschaft zu testen?
  2. Wie kann er testen, ob seine Methode bei echten Daten wirklich funktioniert?
  3. Darf Angus die Daten, mit denen er arbeitet, inhaltlich bewerten?
  4. Muss sich Angus gar dafür interessieren, mit welchen Daten er inhaltlich arbeitet?
  5. Hat Angus eine Handlungspflicht, nachdem er Kenntnis erlangt, dass er mit Daten arbeitet, die der insolventen Firma MediData GmbH anvertraut worden sind? Wenn ja, wie sollte er handeln? Soll er die Daten der MediData GmbH mit denen der DKAG verknüpfen?
  6. Ändert sich dadurch etwas, dass Angus noch in der Probezeit ist? Sollte er in seine Überlegungen einbeziehen, dass seine Karrierelaufbahn einen Knick bekommen könnte?
  7. Ist es vertretbar, dass er seine noch experimentelle Methode nun unbedingt erfolgreich umsetzen muss, um möglichst gute Verknüpfungen zu erzeugen und so vielleicht die Arbeitsplätze zu retten?
  8. Sollte Angus eine Vertrauensperson der Universität oder der DKAG hinzuzuziehen?
  9. Sollte sich Angus an die Öffentlichkeit wenden, als ihm klar wird, dass hier gerade ausgesprochen sensible Daten von Menschen im Rahmen einer Insolvenz weitergegeben und neu verknüpft werden?
  10. Darf sich Angus dabei anmaßen, selbst zu entscheiden, was von öffentlichem Interesse ist und was nicht?

Erschienen Informatik-Spektrum, 38 (5), 2015, S. 429-430

Leave a Reply

You can use these HTML tags

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>