95 Prozent der KI-Piloten bringen nichts, 5 Prozent schon
6 Min. Lesezeit
95 Prozent. So viele KI-Piloten in Unternehmen bringen laut der vielzitierten MIT-Studie zum GenAI Divide keinen messbaren Effekt auf das Ergebnis. Der Grund liegt selten am Modell und fast immer daran, wie das Werkzeug in die tägliche Arbeit kommt. Wer zu den 5 Prozent gehören will, beantwortet eine unbequeme Frage zuerst: Welcher konkrete Prozess soll danach billiger, schneller oder verlässlicher laufen?
Das Wichtigste in Kürze
- Nicht das Modell ist das Problem: Die MIT-Studie führt die ausbleibende Wirkung auf fehlende Prozess-Integration zurück, nicht auf schwache KI. Adoption ist hoch, Transformation niedrig.
- Das Budget liegt am falschen Ort: Das meiste Geld fließt in Marketing und Vertrieb, der messbare Hebel sitzt im Back Office. Genau dort wird am wenigsten investiert.
- Gekauft schlägt selbstgebaut: Eingekaufte Fachlösungen erreichen rund doppelt so oft einen Wirkungsnachweis wie interne Eigenbauten. Für den Mittelstand ist das die wichtigste Lehre.
Verwandt:Schatten-KI im Mittelstand: Was die heimliche Nutzung verrät / Gesellschaftliche Lizenz für KI: Wenn Adoption das Vertrauen überholt
Was die 95 Prozent wirklich aussagen
Die Zahl klingt nach Abrechnung mit der ganzen Technologie, ist aber das Gegenteil. Das Forschungsteam am MIT hat für den Bericht zum GenAI Divide rund 300 öffentlich dokumentierte KI-Projekte ausgewertet und dazu Führungskräfte aus unterschiedlichen Branchen interviewt und befragt. Das Ergebnis: 95 Prozent der Piloten zeigen keinen messbaren Effekt auf die Gewinn-und-Verlust-Rechnung. Nicht, weil die Modelle schlecht wären, sondern weil sie nie an den Punkt kommen, an dem ein Prozess tatsächlich anders läuft.
Was ist der GenAI Divide? Der Begriff beschreibt die Lücke zwischen breiter Nutzung und echter Wertschöpfung. Viele Beschäftigte verwenden KI-Werkzeuge, doch nur wenige Unternehmen verankern sie so in Abläufen, dass sich Kosten, Zeit oder Qualität messbar verschieben. Hohe Adoption, niedrige Transformation.
Für den Mittelstand ist das eine gute Nachricht und eine unbequeme zugleich. Gut, weil das fehlende Stück nicht aus dem Silicon Valley kommen muss. Unbequem, weil es die übliche Ausrede zerlegt. Wer den ausbleibenden Effekt auf die Regulierung oder die Reife der Modelle schiebt, sucht an der falschen Stelle. Das eigentliche Defizit sitzt zwischen Tool und Arbeitsalltag.
Warum gerade das Marketing am wenigsten zurückzahlt
An dieser Stelle muss ich gegen mein eigenes Fach argumentieren. Das meiste KI-Budget landet in Marketing und Vertrieb, weil dort die Werkzeuge am sichtbarsten sind und der Hype am lautesten ist. Eine Kampagnen-Idee in Minuten, zehn Anzeigentexte auf Knopfdruck, eine Persona ohne Workshop. Das fühlt sich nach Fortschritt an und zeigt sich selten in der Bilanz.
Die MIT-Daten legen den Hebel woanders hin. Der nachweisbare Effekt entsteht im Back Office, bei dokumentenlastigen Routinen, in Finanzprozessen, im Service. Dort, wo eine halbe Stunde manuelle Arbeit pro Vorgang anfällt und sich über tausend Vorgänge zu echter Zeit summiert. Genau diese Bereiche bekommen am wenigsten Aufmerksamkeit, weil sie unspektakulär sind. Ein automatisierter Rechnungseingang gewinnt keinen Kreativpreis.
Ein Beispiel aus dem eigenen Maschinenraum macht es konkret. Ein KI-Tool textet zehn Anzeigenvarianten in Minuten, das spart die erste Stunde. Die Conversion-Rate im Funnel bewegt sich davon aber nicht. Sie bewegt sich erst, wenn die Varianten gegen echte Segmente getestet, im CRM sauber zugeordnet und nachgesteuert werden. Der messbare Effekt liegt in dieser Mechanik, nicht im Texten. Wer nur die gesparte Stunde feiert, verwechselt Output mit Wirkung.
Für eine Marketing-Abteilung ohne Konzern-Budget heißt das nicht, die Finger von KI zu lassen. Es heißt, ehrlich zu trennen. Was beschleunigt nur das Gefühl von Tempo, und was senkt wirklich Kosten pro Vorgang? Die zweite Frage führt oft aus dem Marketing heraus.
Was die 5 Prozent anders machen
Die erfolgreichen Projekte teilen ein paar nüchterne Eigenschaften. Sie beginnen mit einem klar umrissenen Vorgang, der heute Geld oder Zeit kostet, und suchen erst danach das passende Werkzeug. Sie kaufen häufiger eine spezialisierte Lösung, statt im eigenen Team ein Tool zu bauen, das niemand wartet, sobald die erste Begeisterung weg ist. Die MIT-Zahlen sind hier deutlich: Eingekaufte Lösungen erreichen in etwa zwei von drei Fällen einen Wirkungsnachweis, interne Eigenbauten nur in rund einem Drittel. Und die Gewinner bereinigen die Datengrundlage, bevor sie ein Tool darüberlegen, weil ein Modell auf unsauberen Daten nur schneller falsch liegt.
Der typische Fehlstart
- Starten mit dem Tool und suchen danach einen Anwendungsfall
- Bauen intern, ohne Plan für Pflege und Betrieb
- Stecken das Budget dorthin, wo der Effekt am schwersten messbar ist
Das Muster der Gewinner
- Starten mit einem teuren Prozess und suchen das passende Werkzeug
- Kaufen spezialisierte Lösungen mit klarem Betreiber
- Bereinigen die Daten, bevor das Modell darauf rechnet
Auffällig ist, wie wenig davon mit Technologie zu tun hat. Im Kern ist es Prozessarbeit mit einem KI-Baustein darin. Das KI-Projekt mit Prozess-Beiwerk scheitert genau an dieser Verwechslung. Der Unterschied entscheidet, ob nach sechs Monaten eine Zahl in der Bilanz steht oder nur eine Folie im Lenkungskreis.
Was der Mittelstand daraus mitnimmt
Ein Mittelständler braucht für den Sprung über den Graben keine eigene Forschungsabteilung. Er braucht einen Vorgang, der oft genug vorkommt, dass sich eine halbe Stunde Ersparnis lohnt, und den Mut, ihn klein zu halten. Ein einzelner, sauber abgegrenzter Use-Case mit einer gekauften Lösung schlägt zehn parallele Experimente, die alle im Pilotstatus versanden.
Praktisch heißt das drei Dinge. Den teuersten wiederkehrenden Prozess benennen, bevor über Tools gesprochen wird. Eine Lösung wählen, die jemand wartet, der nicht im eigenen Haus sitzt. Und vorher messen, wie lange der Vorgang heute dauert, damit der Effekt später kein Bauchgefühl bleibt. Wer diese Reihenfolge einhält, folgt dem Muster der wenigen Projekte, die am Ende eine Zahl vorweisen. Wer sie umdreht, zahlt für die Demo, die im Lenkungskreis applaudiert wird und in der Buchhaltung keiner kennt.
Häufige Fragen
Woher stammt die Zahl, dass 95 Prozent der KI-Piloten scheitern?
Aus dem MIT-Bericht The GenAI Divide: State of AI in Business 2025. Er beruht auf Interviews und Befragungen von Führungskräften sowie der Auswertung von rund 300 dokumentierten KI-Deployments und misst den Effekt auf die Gewinn-und-Verlust-Rechnung.
Liegt das Scheitern an der Qualität der KI-Modelle?
Laut Studie nicht. Der Engpass ist die Integration in bestehende Abläufe, nicht die Leistung der Modelle. Hohe Nutzung trifft auf niedrige Verankerung in den Prozessen.
Sollte ich KI lieber kaufen oder selbst bauen?
Die Daten sprechen klar für Einkauf. Eingekaufte Fachlösungen erreichen rund doppelt so oft einen Wirkungsnachweis wie interne Eigenbauten, vor allem weil Wartung und Betrieb dauerhaft gesichert sind.
Wo erzielt KI im Unternehmen den größten messbaren Effekt?
Im Back Office. Dokumentenlastige Routinen, Finanz- und Serviceprozesse zahlen sich messbar aus, während Marketing und Vertrieb zwar das meiste Budget binden, aber selten einen klaren Bilanzeffekt liefern.
Wie startet ein Mittelständler ein KI-Projekt richtig?
Zuerst den teuersten wiederkehrenden Prozess benennen und seine heutige Dauer messen. Dann eine gewartete Fachlösung wählen, statt selbst zu bauen. Erst danach das Werkzeug einführen und den Effekt gegen die Ausgangsmessung halten.
Lesetipps der Redaktion
Mehr aus dem MBF Media Netzwerk
Bildquelle: KI-generiert (Juni 2026)
