Fallbeispiel: Vibe-Prüfung

Constanze Kurz & Debora Weber-Wulff

Mit KI-Werkzeugen ist Code schnell erstellt. Aber wessen Aufgabe ist es, beim Vibe Coding die Qualität im Blick zu behalten? Dieses Fallbeispiel zeigt, wie sich die Verantwortung im Team verschieben kann.

Heinz, Lemar und Thomas arbeiten in einem größeren Software-Unternehmen. Heinz ist Chef der Entwicklungsabteilung, Lemar ist eine erfahrene Softwareentwicklerin in einem Team von sieben Leuten. Thomas ist der jüngste Kollege im Team, frisch von der Universität.

Nächste Woche ist Messe, da soll das neueste Produkt präsentiert werden. Beim Teamtreffen Anfang der Woche fragt Heinz nach der mobilen App für das Produkt. Die Teammitglieder schauen sich alle gegenseitig an. Lemar sagt: „Davon war bislang nie die Rede, dass wir noch eine App brauchen.“ Heinz widerspricht: „Doch, steht im Pflichtenheft. Das muss bis Samstag fertig werden, wir fahren Sonntag zur Messe!“

Thomas ist bei KI-Werkzeugen ganz groß dabei. Er nutzt mehrere solcher Werkzeuge und ist sehr stolz darauf, wie viel Quellcode er in kürzester Zeit generieren kann. „Das schaffe ich schon mit der KI“, sagt Thomas, nicht ohne Stolz. „Dann leg mal los“, sagt Heinz.

Lemar weiß um die Stärken und Schwächen der KI-Werkzeuge, entsprechend setzt sie einige der Werkzeuge ein, wenn auch sparsam. Thomas hat hingegen an nur einem Tag eine App für das Projekt erzeugt. Tests, die ebenfalls teilautomatisiert mit den KI-Werkzeugen erzeugt und durchgeführt wurden, hätten keine Fehler gefunden, freut sich Thomas. „Das gibt bestimmt eine Gehaltserhöhung“, jubelt er.

Lemar entdeckt darin sofort etliche Fehler und bekommt von der Teamleiterin Flynn den Auftrag, diese Fehler zu beseitigen. Thomas sei unerfahren, er könne das noch nicht. Lemar ist genervt, sie muss nun den generierten Quellcode aufräumen, Fehler ausmerzen, Tests laufen lassen und dabei sogar generierten Quatsch entfernen, alles per Hand. Und was das für Quellcode-Mengen sind! Denn ganz typisch für KI-generierten Quellcode ist, dass vieles doppelt oder sogar dreifach enthalten ist. Damit wird sie bestimmt noch bis Samstag voll beschäftigt sein. Aber sie schafft es, die App wird auf der Messe stolz vorgeführt.

Eigentlich war sie nicht dafür angestellt worden, quasi als „AI slop cleaner“ zu fungieren. Im Retrospektiv-Teammeeting merkt sie an, dass die Fehlerbeseitigung sehr zeitaufwendig gewesen sei. Sie stellt direkt die Frage in den Raum, ob das jetzt der neue Normalzustand sei, dass sie große Mengen von generiertem Code aufräumen müsse. Lemar sagt, auch sie nutze die neuen Werkzeuge, denn sie seien oft praktisch. Aber sie besteht darauf, dass derjenige, der den Code erzeugt, schon noch überblicken und verstehen müsse, was da rauskommt. Sonst entstehe nämlich genau die Situation: Lemar oder andere erfahrene Leute müssten langwierig nachbearbeiten, was Thomas per Klick und Prompt erzeugt habe.

Flynn äußert sich verständnisvoll. Sie sagt aber, dass die Anweisung, diese KI-Werkzeuge zu benutzen, von Heinz käme, was nicht in ihre Verantwortung falle.

Fragen:

Welche ethischen Probleme sehen Sie beim Einsatz der „KI-Werkzeuge“ in der Softwareentwicklung?
Ist es ein ethisches Problem, neue Techniken unter Zeitdruck auszuprobieren?
Ist es ein ethisches Problem, dass der generierte Code technisch unzureichend war, aber von Thomas dennoch als fertige Erweiterung des Softwareprojekts hingestellt wurde?
Besteht ein Unterschied darin, ob eine Softwareentwicklerin eigenhändig prüft, ob fehlerfreier Code generiert wurde, oder ob auch das Testen teilautomatisiert mithilfe von Software geschieht?
Wer ist dafür verantwortlich, wenn Lemar den Code viele Stunden nachbearbeiten muss? Ist es ethisch in Ordnung, dass Heinz von ihr Wochenendarbeit erwartet?
Hat Teamleiterin Flynn die Pflicht zu handeln, als sie darauf hingewiesen wird, dass die KI-Software strukturelle Probleme im Team erzeugt? Darf sie ältere und erfahrene Softwareentwickler*innen weiter mit der Nachbearbeitung von generiertem Code beauftragen?
Können Sie sich Szenarien vorstellen, in denen der Einsatz von KI-Hilfen unerlässlich wäre?
Angenommen, Lemar hätte sich anders entschieden und sich geweigert, den generierten Code aufzuräumen: Hätte Thomas dann die Verpflichtung, sein Softwareprojekt eigenhändig zu prüfen? Kann er das überhaupt?
Hätte Heinz den Einsatz der KI-Hilfen kritischer prüfen müssen?
Wie ist die Entscheidung von Flynn, auf Heinz zu verweisen, generell ethisch einzuschätzen?

Erschienen in .inf 12, Das Informatik-Magazin, https://inf.gi.de/12/vibe-pruefung, Winter 2025.

Georg

23. Dezember 2025 at 13:58 · Reply

Aus meiner Sicht zuviel Klischee: jung, unfähig zur Selbstreflexion, gehaltsfixiert – erfahren, leisten (leiden) ohne zu klagen, Schieflagen retten – Führungsversagen in mehreren Dimensionen.

Ist das Fallbeispiel selbst KI-gestützt ausformuliert worden?

Constanze

2. Januar 2026 at 01:49 · Reply

Dieses Fallbeispiel ist von zwei Menschen formuliert (siehe oben) und beruht auf tatsächlichen Erfahrungen. Wir überzeichnen in solchen Fallbeispielen oft Eigenschaften handelnder Personen und bauen Klischees ein, und zwar deswegen, weil wir zuspitzen und dadurch Diskussion anregen wollen. Das Beispiel ist mit Fragen versehen, die genutzt werden können, wenn das Szenario in der Lehre verwendet wird.

Gabriele

2. Januar 2026 at 21:58 · Reply

Meine Erfahrung in der Lehre (Modul Informatik und Gesellschaft) ist, dass sich Studierende tatsächlich manchmal über die Klischees in den Gewissensbits beklagen.
Wie Constanze schreibt, lassen sich die Fragen dann aber gut nutzen, um das eigentliche Thema zu diskutieren. Auch das von Georg angesprochene Führungsversagen wird in den Fragen ja adressiert.

Gewissensbits

Fallbeispiele Chronologisch

English Scenarios

Aktuelles

Kommentare

Archiv

Kommentare

Fallbeispiel: Vibe-Prüfung

3 comments to Fallbeispiel: Vibe-Prüfung

Leave a Reply Cancel reply

Autoren

Kategorien

Meta