Wenn du die Regel aufschreiben kannst, brauchst du keine KI
Viele KI-Agenten sind ein Cronjob mit Extraschritten. Eine einfache Faustregel, wann ein Sprachmodell wirklich Sinn macht und wann ein if-Statement die bessere Lösung ist.
Ich sehe gerade fast täglich einen Post nach demselben Muster. "Ich habe einen KI-Agenten gebaut, der X macht." Und immer öfter denke ich beim Lesen, das hätte ein Cronjob auch gekonnt. Günstiger, schneller und ohne die Chance, sich spontan etwas auszudenken.
Ein paar echte Beispiele, die mir untergekommen sind. Jemand lässt einen Agenten im Minutentakt den Sitzplan einer Airline prüfen und den Platz tauschen, sobald ein besserer frei wird. Da testet man eigentlich nur, wie schnell die eigene IP gesperrt wird. Jemand anderes lässt eine KI Bestätigungsmails lesen und die Reisedaten an Kollegen weiterschicken. Und wieder jemand setzt ein Sprachmodell auf das Erneuern von SSL-Zertifikaten an, also auf eine Aufgabe, bei der ein einziger Fehler die halbe Infrastruktur lahmlegt.
Und genau da liegt für mich der Kern. Die meisten, die so etwas bauen, haben nie gelernt, die Aufgabe ohne KI zu lösen. Ihnen fehlt das mentale Modell dahinter. Deshalb fühlt sich jeder funktionierende Agent wie Magie an, auch wenn er nur eine umständliche Version von etwas ist, das längst gelöst war.
Der eine Test, der fast immer reicht
Es gibt eine simple Faustregel. Wenn du die Regel dafür aufschreiben könntest, dann schreib die Regel. Oder anders gesagt, wenn du den Entscheidungsbaum auf ein Whiteboard malen kannst, lass das Sprachmodell weg.
Ein Sprachmodell auf eine eindeutige, regelbasierte Aufgabe zu setzen macht aus einer zuverlässigen Sache eine unzuverlässige. Du tauschst ein if-Statement, das immer dasselbe tut, gegen etwas Langsameres und Teureres. Und du handelst dir eine neue Fehlerklasse ein, die du vorher nicht hattest, denn das Modell kann jetzt Dinge erfinden. Ein if-Statement tut das nie. Zugespitzt gesagt, ein LLM, das eine deterministische Aufgabe erledigt, ist keine Intelligenz, sondern eine langsamere, teurere und weniger verlässliche Version eines if-Statements, mit einem neuen Risiko obendrauf.
Der SSL-Fall ist dafür das Paradebeispiel. Zertifikate erneuern ist ein gelöstes Problem. Es gibt Tools, die das seit Jahren langweilig zuverlässig tun. Ein Modell die finale Entscheidung treffen zu lassen ist kein Fortschritt, sondern ein Rückschritt mit Extrarisiko.
Wo KI wirklich glänzt
Das hier ist ausdrücklich kein "KI ist Hype"-Text. Ich baue diese Systeme beruflich, und es gibt Aufgaben, bei denen ein Sprachmodell nicht nur hilft, sondern Dinge möglich macht, die vorher gar nicht automatisierbar waren.
Die Trennlinie ist dabei nicht kompliziert. Setze KI ein, wenn der schwere Teil die Mehrdeutigkeit ist, und nicht, wenn der schwere Teil die Zuverlässigkeit ist.
Ein Modell ist stark, wenn der Input unstrukturiert und unscharf ist, wenn keine zwei Eingaben gleich aussehen, wenn du im Vorfeld gar keine Regel formulieren könntest, weil die Wirklichkeit zu chaotisch dafür ist. Sinn aus freiem Text ziehen, aus Mails und Notizen und Dokumenten, die alle anders aufgebaut sind. Unscharfes Zuordnen, wo eine starre Tabelle scheitert. Chaotische Eingaben sortieren und weiterleiten. Aus vielen verstreuten Quellen einen Entwurf bauen, den am Ende ein Mensch absegnet.
Das sind Aufgaben, bei denen ungefähr richtig mit Kontrolle mehr wert ist als exakt nach Regel, weil es vorher schlicht keine Regel gab.
Der eigentliche Fehler liegt in der Mitte
Spannend wird es beim Reisemail-Beispiel, weil da beide Welten aufeinandertreffen. Die Reisedaten aus einer formlosen Bestätigungsmail zu fischen ist genau das, was ein Modell gut kann, unstrukturierter Text ohne festes Format. Das ist eine faire Aufgabe für KI.
Der Fehler ist nicht die Extraktion. Der Fehler ist, das Modell die Mail danach auch noch eigenständig verschicken zu lassen.
Damit sind wir beim Muster, das fast alle gescheiterten KI-Projekte teilen. Es ist ein Denkfehler in zwei Richtungen. KI komplett abzulehnen ist genauso falsch wie KI alles entscheiden zu lassen. Der sinnvolle Aufbau liegt dazwischen und ist geschichtet. Das Modell ist die Ebene, die versteht und interpretiert. Die eigentliche Aktion macht deterministischer Code.
Das Modell liest die Mail und zieht die Daten heraus, das ist der Teil mit Urteilsvermögen, und der rechtfertigt das Modell. Das Verschicken läuft über eine feste, geprüfte Funktion, mit einer Bestätigung davor bei allem, was echte Folgen hat. Das Bewerten verdient das Modell. Das Ausführen nicht.
Meine eigene Grenze dabei ist einfach. Wenn ich für eine Aktion keinen Weg habe, das Ergebnis automatisch zu prüfen, also keinen Beleg und keine Kontrollinstanz, dann darf der Agent diese Aktion nicht allein ausführen. Vorschlagen ja, entwerfen ja, überwachen ja. Aber nicht von sich aus auf Senden drücken.
Fazit
Für mich ist es am Ende keine Frage von für oder gegen KI. Wenn der KI-Agent ein Hammer ist, sieht jede Aufgabe, die sich automatisieren lässt, plötzlich wie ein Nagel aus. Genau da geht es schief. Viele dieser Projekte sind ein Cronjob mit ein paar Extraschritten, nur dass der Cronjob nie halluziniert hat.
Die eigentliche Fähigkeit ist nicht, überall KI reinzukippen. Sie ist, vom Problem auszugehen statt vom Werkzeug, und ehrlich genug zu sein, an der richtigen Stelle zu sagen, das hier braucht kein Sprachmodell. Die teuerste Lösung ist selten die beste, und die beeindruckendste Demo ist fast nie die, die im Alltag zuverlässig läuft.