Warum du deinen KI-Tech-Stack gegen KI-Beben absichern solltest

KI-Kompetenzzentrum MedienWarum du deinen KI-Tech-Stack gegen KI-Beben absichern solltest

Warum du deinen KI-Tech-Stack gegen KI-Beben absichern solltest

Was hat der Quellcode-Leak bei Anthropic mit dem Ende von OpenAIs Video-Plattform Sora zu tun? Augenscheinlich wenig, aber auf den zweiten Blick offenbaren sie ähnliche strukturelle Schwachstellen beim Einsatz von generativen Technologien. Wenn Einzelereignisse wie diese die Rahmenbedingungen für die Medienproduktion über Nacht ändern können, stellt sich die Frage: Wie resilient kann und muss ein Tech-Stack sein?

Die Antwort darauf suchen wir in unserem KI-Reallabor. Dabei geht es auch darum, wie kompakte Open-Weights-Modelle lokale KI-Workflows unterstützen können. Denn: Wer bei unternehmenskritischen Workflows auf die Anbieter von Foundation Models wie denen von Anthropic oder OpenAI setzt, übergibt auch die Kontrolle an Dritte. In der Praxis bedeutet das technologische Abhängigkeit in einem Zeitalter, in dem geopolitische Unwägbarkeiten technologische Souveränität eigentlich zur operativen Notwendigkeit machen.

Was wir vom Claude-Leak lernen können

Die Geschichte vom Claude-Leak beginnt mit einem klassischen Deployment-Fehler im April 2026. 500000 Zeilen des Quellcodes von Claude Code, einem KI-Tool von Anthropic, das eigenständig komplexe Programmieraufgaben über Dateisysteme hinweg erledigen kann, waren kurzzeitig offen einsehbar. Das ist insofern brisant, als dass dadurch die Funktionsweise im Inneren der Software publik wurde. Software-Engineering-Probleme wie diese sind keine Seltenheit. Das eigentlich Ironische: Anthropic inszeniert sich als Vorreiter in Sachen AI Safety, um sich von Rivalen wie OpenAI abzugrenzen – und stolpert doch über dieselben Fehler wie alle.

Entwickelnden liefert dieser Vorfall wertvolle Einblicke in die technische Funktionsweise von KI-Werkzeugen. Der Leak zeigt, dass reine Large Language Model (LLM) bei Claude Code nur eine Komponente innerhalb eines komplexen Agenten-Systems darstellt. Die eigentliche Leistungsfähigkeit entsteht durch den Harness, eine umfangreiche Code-Infrastruktur, die das Modell umschließt. Dieser Ansatz ähnelt denen, die bei Open-Source-Projekten wie OpenClaw eingesetzt wurden. Der entscheidende Unterschied: Claude Code versteht sich als produktionsreife Architektur mit umfangreichen Fehlerbehandlungen. Ein Großteil des Codes dient ausschließlich dazu, Tools aufzurufen, API-Fehler abzufangen und den System-Kontext zu verwalten.

Die autonomen Hintergrundprozesse, die Anthropic intern als KAIROS bezeichnet, sind dafür ein faszinierendes Beispiel. Sie zeigen, wie ein KI-Agent seine Schritte plant, Protokolle aufwertet und Strategien verwirft. All das geschieht, bevor der User auch nur einen Buchstaben des Outputs zu Gesicht bekommt. Für die meisten Anwender:innen sind diese Prozesse irrelevant. Mit dem entsprechenden technischen Know-how werden sie so offen gelegt: Technikexpert:innen könnten diese Software-Architektur selbst verwenden und eigene Systeme verbessern. Oder sie verwenden dieses Wissen, um Agenten zu manipulieren und Malware einzuschleusen.

Für Unternehmen sollte der Leak vor allem ein Weckruf sein. Das Auslagern von sicherheitskritischen Prompts, RAG-Daten und internen Workflows in fremde Cloud-APIs ist zwar praktisch, aber eben riskant. Es hilft, LLMs als das zu betrachten, was sie eigentlich sind: “dumme”, aber sehr fähige Text- und Code-Generatoren, die viel Aufsicht erfordern.

Wie wird KI zum profitablen Geschäftsmodell?

Unterdessen hat OpenAI angekündigt, seiner Bewegtbildplattform Sora im September 2026 den Stecker ziehen zu wollen. Für OpenAI war Sora vor allem ein Verlustgeschäft, das trotz Kooperationen mit Disney nach einem fulminanten Start mit einem Nutzerschwund kämpfen musste. Unternehmen, die auf die entsprechende API setzen, haben noch bis zum offiziellen Ende der Plattform Zeit, um ihre Workflows umzustellen. De facto ist das aber nicht immer möglich.

Der Rückzieher wirft aber noch mehr Fragen auf. Zum Beispiel: Wie steht es um die langfristige Rentabilität massiver Cloud-basierter KI-Angebote? Und wie wirkt sich das auf die Kostenfrage für Endnutzer:innen aus? Wie so oft, wenn es um KI geht, sind konkrete Antworten schwer möglich. Überhaupt ist die Suche nach tragfähigen Geschäftsmodellen eine der Kernaufgaben für KI-Unternehmen. OpenAI selbst tut sich trotz Rekordinvestionen schwer, profitabel zu sein.

Sora ist damit das Paradebeispiel für den Vendor Lock-in: Wer KI nutzt, ist abhängig von den Launen (und dem Überleben) der großen Provider. Technologische und ökonomische Abhängigkeiten erschweren den Wechsel zu einem Konkurrenzprodukt oder machen ihn gar unmöglich. Im KI-Bereich betrifft das nicht zuletzt die Qualität der Anwendung. KI-Modelle unterschiedlicher Anbieter erzielen unterschiedliche Ergebnisse bei derselben Aufgabe. Die Qualität dieses Outputs entscheidet schließlich, ob sich ein Produkt für den Verkauf oder überhaupt für die verlässliche Verwendung eignet.

Wie Edge-Einsatz zur Lösung werden kann

Was also tun, wenn technologische Souveränität auch im KI-Bereich geschäftskritisch wird? Open-Weights-Modelle wie die Gemma-4-Modelle von Google können weiterhelfen. Die Gemma-4-Reihe wurde unter der Apache-2.0-Lizenz veröffentlicht und ist explizit für den Edge-Einsatz optimiert. Das bedeutet, dass sie auch auf Geräten mit begrenzten Kapazitäten funktionieren und kommerziell genutzt werden können. Sie tragen damit strukturell zu mehr Datensouveränität bei, denn die Datenverarbeitung erfolgt lokal innerhalb der eigenen Infrastruktur.

Nicht jeder Schritt in einem KI-basierten Workflow erfordert ein großes Frontier-Modell. Klassifikation, Vorfilterung, Formatkonvertierung und einfache Extraktionsaufgaben können von kleineren, lokal betriebenen Modellen mit deutlich geringerem Ressourcenaufwand übernommen werden. Große Modelle sind dann nur noch erforderlich, wenn es um komplexe Analyse- oder Generierungsaufgaben geht.

Fazit: Kenne deinen Feind

Wer KI-Workflows auf externer Infrastruktur aufbaut, akzeptiert ein strukturelles Risiko. Es bedeutet, die Kontrolle über Modelle, Daten und Orchestrierungslogiken aufzugeben, obwohl das aus technologischer Perspektive nicht notwendig ist. Open-Weights-Modelle schließen zunehmend die Qualitätslücke zu proprietären APIs in vielen Anwendungsbereichen. Hybride Architekturen, Kombinationen aus lokalen Modellen für Vorverarbeitung und Servermodellen für komplexe Aufgaben bieten Resilienz ohne Qualitätsverlust.

Und zu guter Letzt: Der Claude-Leak hat eine Welle abgeleiteter Agenten-Frameworks auf Plattformen wie GitHub hervorgebracht. Viele dieser Repositories sind nur wenig vertrauenswürdig und enthalten mit etwas Pech modifizierten Code, der gezielt Daten abgreifen kann. Wer Open-Source-Frameworks einsetzt, muss den Code selbst überprüfen. Technologische Souveränität beginnt nicht mit dem richtigen Modell, sondern mit dem Verständnis der eigenen Angriffsfläche.

Dieser Beitrag gibt eine Einschätzung zur strategischen KI-Einführung, ersetzt aber keine individuelle Beratung für dein spezifisches Unternehmen.

Bei der Erstellung des Beitragsbildes sowie des Textes kam generative Künstliche Intelligenz unterstützend zum Einsatz.

Wir freuen uns, euch vom 22. – 24. Oktober 2025 auf den #MTM25 begrüßen zu dürfen. Mit der „Media For You“ gibt es auch wieder die beliebte Career-Erlebnismesse zum Thema Jobs & Ausbildung.