Constanze Kurz & Debora Weber-Wulff
Elisabeth arbeitet als Informatikerin für eine Firma, die Spracherkennungssoftware entwickelt, anbietet und im Einsatz bei Vertragskunden betreut. Typisch sind Produkte, die Anrufe von Menschen entgegennehmen, deren Wünsche oder Fragen herausfinden, um sie gezielt einem geeigneten Mitarbeiter zum Gespräch zuzuführen oder durch Standardansagen ohne menschliche Intervention zu erledigen. Dazu analysiert die Spracherkennung die am Telefon gesprochenen Wörter und versucht, sie entsprechend vorgegebener Entscheidungsbäume zu interpretieren. Üblich ist, dass die Richtigkeit der Erkennung ab und an durch Gegenfragen getestet wird.
Zur Zeit werden einige der Produkte erweitert, um Menschen durch natürlich klingende Sprache zu simulieren. Wird das Produkt erfolgreich in Deutschland sein, ist eine Expansion in andere europäische Ländern geplant.
Das Produkt, das Elisabeth mitentwickelt hat, springt nach dem ersten Klingelton an, nimmt die Anrufe computergestützt entgegen und wickelt sie entlang der Entscheidungsbäume ab. Als erstes wird in der Datenbank nachgeschaut, ob Erfahrungen mit diesem Kunden vorliegen. Es wird auch versucht, die Adresse des Anrufers zu ermitteln, denn je nach Wohnlage können unterschiedliche Entscheidungen angesteuert werden.
In der Regel wird der Anrufer nach wenigen Fragen zu einem passenden Mitarbeiter geleitet, ein Teil der Wünsche und Fragen wird sogar vollständig ohne menschliche telefonische Interaktion erledigt. Für den Fall, dass jemand von der Software überwiegend oder überhaupt nicht verstanden wird oder die Software feststellt, dass die Stimme sehr ärgerlich und laut geworden ist, gibt es zusätzlich ein Ansageband, das den Anrufer bittet, auf den nächsten freien Mitarbeiter zu warten. Die Firmen, die das Softwaresystem einsetzen, können sogar eine Mindestverweildauer in dieser Warteschleife angeben, denn es können verschiedene aktuelle Angebote dazugeschaltet werden.
Der Weg zur telefonischen Problemlösung soll jedoch möglichst kurz sein, denn Untersuchungen haben gezeigt, dass die Kunden ungeduldig werden, wenn sie viele verschiedene Fragen beantworten müssen, jedoch durchaus einige Minuten in einer Warteschleife ausharren. Softwareseitig ist definiert, dass nach durchschnittlich zwanzig Sekunden eine Entscheidung getroffen sein soll, ob die Sprache des Anrufers verstanden und eingeordnet werden kann oder direkt zu einem Menschen weitergeleitet wird.
In Elisabeths Firma ist als neue Kundin eine mittelgroße deutsche Stadt akquiriert worden, die bereits seit sechs Monaten erfolgreich Spracherkennungssysteme einsetzt, um Bürgeranfragen zu bearbeiten und beantworten. Als Teamleiter Frank mit Elisabeth und ihren Kollegen die neuen Aufträge der Stadt diskutiert, erfährt das Team, dass ab dem nächsten Jahr auch die Notrufzentrale mit der Erkennungssoftware ausgestattet werden soll. Es kostet einfach viel Geld, die Notrufzentrale rund um die Uhr mit bis zu zehn Disponenten auszustatten.
Die Notrufentgegennahme orientiert sich an den sogenannten „sechs Ws“: Wer meldet den Notfall? Was geschah? Wo geschah es? Wieviele Verletzte gibt es? Welche Art der Verletzung liegt vor? Warten auf Rückfragen!
Diese sechs Informationen können sehr einfach durch ein Spracherkennungssystem unterstützt werden, besonders mit einer guten Datenbankanknüpfung. So können auch häufige Scherzanrufer schnell identifiziert und der Standort des Anrufers schnell und zuverlässig bestimmt werden.
Frank stellt sich das so vor, dass die Anrufer gar nicht merken, dass sie mit einem Computer sprechen, damit sie nicht übermäßig hektisch werden. Sie sind in der Regel sowieso aufgeregt, wenn sie den Notruf anwählen. Elisabeths Team ist begeistert von der technischen Herausforderung, nicht nur viele verschiedene Dialekte erkennen zu müssen, sondern die Stimmen auch in Stress-Situationen korrekt auswerten zu können. Es wird auch viel spannender sein, die Entscheidungsbäume für dieses Anwendungsgebiet zu erstellen als für den Customer Support beim örtlichen Computermarkt.
Elisabeth besucht die Leitstelle an einem Freitag, um ein Gefühl dafür zu bekommen, was für Gespräche ankommen, um dann die Entscheidungsbäume zu konzipieren. Sie ist überrascht zu sehen, dass es zwanzig Arbeitsplätze gibt. Es stellt sich heraus, dass bei großen Veranstaltungen oder an Silvester regelmäßig alle Plätze belegt sind. Und als es vor fünfzehn Jahren einmal einen Unfall bei einer Flugshow gab, wurden alle irgendwie verfügbaren Disponenten einbestellt, dennoch kamen etliche Personen nicht beim Notruf durch, und die Krankenwagen waren nicht schnell genug vor Ort. Danach war die Platzanzahl auf zwanzig Personen angehoben worden.
Während sie mit einem Disponenten plaudert, gehen plötzlich alle Telefone an. Eine Explosion hat sich mitten in der Stadt ereignet. Der Schichtleiter ruft weitere Disponenten hinzu. Ein Krankenhaus mitten in der Stadt ist von der Explosion betroffen, die Patienten müssen auch noch in umliegende Krankenhäuser verteilt werden. Elisabeth ist komplett überfordert, sie kann gar nicht mitschreiben, was alles gefragt und entschieden wird. Wie soll sie hieraus Entscheidungsbäume erstellen?
Was soll Elisabeth tun?
FRAGEN
In diesem Szenario sind einige ethische Fragestellungen aufgeworfen. Die Hauptfrage ist die der Bewertung von automatisierter Bearbeitung menschlicher Meldungen in Notfallsituationen:
- Ist es überhaupt denkbar, in einem Notfall mit einer Maschine zu sprechen? Was ist, wenn etwas Katastrophenartiges passiert (Vulkanausbruch, Massenpanik), was nicht in den Entscheidungsbäumen abgebildet ist?
- Bei Spitzenbelastungszeiten könnten einige Anrufer direkt in die Warteschleife umgeleitet werden müssen, da alle Plätze bereits belegt sind. Ist das ein Problem?
- Menschen sprechen anders, wenn sie Angst haben oder in Panik sind. Kann man maschinell damit umgehen?
- Ist es möglich, ein System so zu bauen, dass es skaliert für Spitzenzeiten?
- Was ist, wenn das System ausfällt, weil es zum Beispiel gehackt wurde oder die Software fehlerhaft ist? Ist es ein ethisches Problem, wenn Software in seltenen Situationen technisch unzureichend sein kann, aber im Regelfall die Abwicklung von Notrufen positiv beeinflusst?
- Welche weiteren ethischen Probleme sehen Sie beim Einsatz der Spracherkennungssoftware?
- Besteht ein prinzipieller Unterschied, ob ein Mensch oder ein Computer mit Hilfe einer Software einen Notruf annimmt? Ändert sich diese Bewertung, wenn die Notrufannahme nur teilautomatisiert ist?
- Wer ist für den Schaden verantwortlich, wenn ein Verletzter aufgrund einer fälschlichen Ausgabe der Software Nachteile (etwa durch Zeitverzug) hat oder gar stirbt?
- Hat Elisabeth die Pflicht zu handeln, als sie erkennt, dass die Entscheidungsbäume der Software nur für den Normalbetrieb, strukturell jedoch nicht für Ausnahmesituationen geeignet sind? Ist es ethisch vertretbar, dass sie dennoch zum Einsatz kommen?
- Ist die Benutzung einer solchen Software angesichts der Fehleranfälligkeit des Menschen gar geboten, wenn sie im Regelfall solide arbeitet?
Erschienen in Informatik Spektrum 37(6), 2014, S. 608f.
Bild von gracey.
Kommentare