10.06.2026 · KI · ca. 5 Min. Lesezeit

Wenn KI-Kosten im Projekt ankommen

Warum Tokens nicht nur Abrechnungseinheiten sind, sondern bald Arbeitsprozesse, Boni, Team-Macht, Auftraggeber-Erwartungen und Produkt-Qualität beeinflussen.

Wenn KI-Nutzung sichtbar teuer wird, wandern Tokens aus der Anbieterrechnung in den Arbeitsalltag: als Budget, als Statussignal, als Teamkonflikt und als Frage an Auftraggeber. Das wird gefährlich, wenn daraus falsche Produktivitätsmetriken entstehen.

#KI#Generative AI#Token Costs#AI Governance#Softwareentwicklung

Ein Laptop mit Code, umgeben von technischen Arbeitsmitteln

Meine These

Tokens sind nicht nur die Abrechnungseinheit von KI-Modellen. Sie werden zur neuen Arbeitsmetrik. Es geht nicht nur darum, dass KI teuer wird. Es geht darum, was Unternehmen tun, wenn diese Kosten plötzlich sichtbar, zuordenbar und intern politisch werden.

Sobald KI-Nutzung nicht mehr wie ein Flatrate-Wunder wirkt, beginnt die eigentliche Organisationsfrage: Wer verbraucht wie viel, für welches Ergebnis, aus welchem Budget und warum?

Was plausibel wird

Aus der Kostenfrage ergibt sich eine Reihe naheliegender Entwicklungen: Persönliche Token-Budget, Token-Poker als neue Schätzmethode, Team- und Organisationsbudgets und am Ende die dunklere Variante: mehr Budget für diejenigen, die sichtbar am meisten KI benutzen oder am meisten Code erzeugen.

Sobald Tokens knapp werden, verhalten sie sich wie jede andere knappe Unternehmensressource. Sie bekommen Budgets, Gatekeeper, Status, Missbrauchsmuster und Metriken. Damit wandert KI aus der Demo-Ebene in die Budget-Ebene. Dort werden technische Werkzeuge schnell zu sozialen Systemen.

Der Flatrate-Moment ist vorbei

Die erste Enterprise-KI-Welle wurde oft verkauft, als wäre Nutzung selbst der Beweis für Erfolg. Mehr Prompts, mehr Agent Runs, mehr erledige Issues, mehr Zusammenfassungen, mehr Code. Das sah nach Fortschritt aus, solange die Kosten unscharf blieben.

Nun wird die Rechnung konkreter. Grosse Kontexte, teure Modelle, Agent Runs und wiederholte Generierung erzeugen nicht nur Infrastrukturkosten. Sie erzeugen auch Review-Aufwand, Nacharbeit, Sicherheitsrisiken und technische Schulden. Wer den Verbrauch nicht einem Ergebnis zuordnen kann, weiss nicht, ob er Produktivität oder nur Aktivität finanziert.

Token-Budgets verändern Verhalten

Wenn Mitarbeitende ein persönliches Token-Budget bekommen, entsteht sofort ein Anreizsystem. Das kann sinnvoll sein. Wer effizient mit teuren Ressourcen umgeht, sollte nicht bestraft werden. Aber die Risiken sind offensichtlich.

Ein Budget kann Menschen dazu bringen, gute KI-Nutzung zu vermeiden, weil sie ihren Verbrauch nicht sichtbar machen wollen. Es kann Teams zu billigeren, schlechter passenden Modellen drängen. Oder es bewirkt das Gegenteil: Menschen verbrauchen ihr Budget, weil sie Kürzungen im nächsten Budget befürchten.

Das Problem ist nicht das Budget selbst. Das Problem ist die Metrik dahinter. Wenn Token-Sparen automatisch als gute Arbeit gilt, wird Unterinvestition belohnt. Wenn Token-Verbrauch automatisch als moderne Arbeit gilt, wird schlechter Output belohnt.

Schätzen, verhandeln, ranken

Token-Poker klingt absurd, ist aber naheliegend. Wenn ein Feature nicht nur Entwicklungszeit, sondern auch Token kostet, wird irgendjemand versuchen, diesen Verbrauch zu schätzen: Brauchen wir ein grosses Context Window? Reicht ein kleineres Modell? Können wir Agent Runs begrenzen? Wie prüfen wir das Ergebnis?

Das kann sinnvoll sein, solange es Wert sichtbar macht. Gefährlich wird es, wenn Token-Schätzung das Denken ersetzt: Nicht mehr, ob ein Feature sinnvoll ist, sondern ob es ins Budget passt. Nicht mehr, ob ein Ergebnis belastbar ist, sondern ob der Agent Run günstig genug war.

Token-Zugang wird zur Machtfrage. Nicht jedes Team bekommt dieselbe Arbeitsfähigkeit. Nicht jede Person hat dieselbe Experimentierfreiheit. Und nicht jedes Ergebnis ist vergleichbar, wenn die zugrunde liegende Ressource ungleich verteilt ist.

Am gefährlichsten wird es, wenn das Management daraus Rankings baut. Mehr generierter Code, mehr geänderte Zeilen, mehr KI-Aktivität, mehr Budget. Lines of Code waren schon vor KI eine schwache Metrik. Mit KI werden sie noch schlechter, weil die knappe Ressource nicht mehr das Schreiben ist, sondern das Verstehen, Prüfen, Reduzieren und Verantworten.

Die Kundenfrage kommt später

Noch werden Tokens in vielen Projekten einfach verbraucht. Sie stecken irgendwo in Tool-Abos, internen Plattformkosten oder Experimentierbudgets. Für Auftraggeber ist das bequem unscharf. Viele gehen ohnehin davon aus, dass Unternehmen KI nutzen. Manche rechnen sogar damit und erwarten implizit, dass Arbeit dadurch schneller oder günstiger wird.

Dort entsteht die nächste Verhandlung. Wenn KI-Kosten intern sichtbar werden, wird das Management irgendwann fragen, ob diese Kosten vollständig im Unternehmen bleiben sollen. Der nächste Schritt ist naheliegend: KI-Nutzung wird Teil des Angebots. Mit oder ohne KI? Weniger Kosten bei längerer Lieferzeit? Oder höherer Preis für mehr Tempo?

Das klingt nach Wahlfreiheit, kann aber schnell zur Scheintransparenz werden. Denn KI ersetzt nicht einfach Zeit durch Tokens. Sie verschiebt Kosten. Weniger Implementierungszeit kann mehr Review-Zeit bedeuten. Ein schneller Prototyp kann mehr Klärung, mehr Tests und mehr Aufräumen brauchen. Ein günstigeres Modell kann später teurer werden, wenn seine Fehler schwerer zu finden sind.

Für Anbieter ist die Versuchung gross, KI als Premium-Beschleuniger zu verkaufen. Für Auftraggeber ist die Versuchung genauso gross, KI als Rabattargument zu verwenden: Wenn ihr sowieso KI nutzt, warum kostet das Produkt dann noch so viel?

Fair wäre, KI nicht als magischen Liefermodus zu verkaufen, sondern als explizite Arbeitsannahme. Ein Angebot müsste dann nicht nur Tempo und Preis nennen, sondern auch Review-Tiefe, Modellabhängigkeit, Datenschutz, Nachvollziehbarkeit und Haftung. Sonst wird aus mit KI nur ein neues Label, unter dem alle etwas anderes verstehen.

Was KI-Governance leisten müsste

Für mich folgt daraus kein Anti-KI-Argument. Es folgt ein Governance-Argument. Unternehmen brauchen nicht einfach weniger KI. Sie brauchen bessere Regeln für wertvolle KI-Nutzung.

Ich würde auf diese Punkte achten:

Token-Kosten pro Workflow messen.
Budgets an Aufgabenrisiko und Ergebniswert koppeln.
Output-Menge nie als primäre Produktivitätsmetrik verwenden.
Modellwahl begründen: billig, schnell, präzise oder risikoarm.
Teams nicht anhand ungleicher KI-Budgets vergleichen.
KI-Nutzung in Angeboten nicht als pauschales Rabatt- oder Premiumversprechen behandeln.
Menschliche Review-Zeit als Kostenbestandteil einrechnen.
Gute Reduktion belohnen: weniger Code, weniger Kontext, weniger Schleifen.

Abschliessende Gedanken

Die Kostenfrage wird KI nicht verschwinden lassen. Sie wird KI normalisieren. Und Normalisierung bedeutet in Unternehmen fast immer: Budgets, Regeln, Zuständigkeiten, Verteilungskämpfe und Metriken.

Die entscheidende Frage ist deshalb nicht, ob Tokens teuer sind. Die Frage ist, welche Arbeitskultur entsteht, wenn Denken, Experimentieren und Generieren als verbrauchbare Ressource gemessen werden. Wenn Unternehmen daraus nur neue Rankings bauen, bekommen sie mehr Output und mehr Aktivität. Aber nicht automatisch mehr Wert.