On-Premise-KI-Modelle: Welche Lizenzen gibt es und was muss ich beachten?

KI-Modelle speziell auf die eigenen Inhalte und Anwendungen zuzuschneiden wird für Medienhäuser zunehmend interessanter. Denn während cloudbasierte KI-Dienste wie ChatGPT oder Midjourney nur über Online-Schnittstellen (APIs) verfügbar sind, laufen sogenannte On-Premise-Modelle in der Regel auf deinen eigenen Firmenservern. Du profitierst von deutlich erhöhter Datensicherheit, weniger Compliance-Komplexität und langfristiger Planbarkeit.
Das bedeutet aber nicht, dass die Installation eines KI-Modells auf eigener Hardware dich von allen Verpflichtungen entbindet. In der Praxis solltest du als Medienschaffender, wenn du auf On-Premise-KI setzt, daher genau wissen, was die jeweiligen Nutzungslizenzen beinhalten. Nicht jedes Modell darfst du für jeden Zweck verwenden und nicht immer ist eine kommerzielle Nutzung erlaubt.
Wie es sich für die gängigsten Nutzungslizenzen verhält, hat das KI-Kompetenzzentrum Medien (KI.M) recherchiert.
Warum kann es sich für dich lohnen, KI-Modelle selbst zu betreiben?
Mehrere Gründe sprechen dafür, dass du ein KI-Modell auf lokaler und gesicherter Infrastruktur betreiben solltest. Insbesondere der hohe Grad an Individualisierbarkeit kann in der Medienpraxis deine Arbeitsabläufe erheblich erleichtern: Mit Finetuning oder Low-Rank Adaptation (LoRA) kannst du generative KI-Systeme so schulen, dass sie deinen unternehmensspezifischen Schreibstil übernehmen, bestimmte Fachthemen eigenständig abdecken oder interne Abläufe effizienter machen. Beispielsweise kann generative Künstliche Intelligenz dir spezifisch modifizierte Textvorschläge für die Content-Produktion bereitstellen.
Weil sensible Daten niemals deinen eigenen Server verlassen, können sie ein echter Gamechanger in Sachen Datenschutz sein. Sicherheitslücken bei Cloud-Diensten spielen damit praktisch keine Rolle. Du kannst sicherstellen, dass deine Mitarbeitenden vertrauliche Informationen nicht aus Versehen Dritten zukommen lassen. On-Premise-Systeme erschließen damit überhaupt erst ganze Domänen für die datenschutzgerechte KI-Verarbeitung. Und weil sie lokal betrieben werden, bist du weitestgehend unabhängig von den Unwägbarkeiten externer KI-Hersteller. Langfristig kann sich daher die Investition in eigene Infrastruktur für dein Medienhaus lohnen, weil mangelhafte Systemkapazitäten, volatile Preispolitik oder die Veränderung des Modells durch Aktualisierung oder gar Abschaltung keine ernsthafte Bedrohung mehr darstellen.
Welche Nutzungsrechte räumen dir die Hersteller ein?
Was du konkret machen darfst, verraten dir die Lizenzbedingungen der jeweiligen Modelle. Das Gros der Lizenzmodelle kannst du einem von fünf Typen zuordnen. Sie unterscheiden sich hinsichtlich ihrer Freizügigkeit bei der Verwendung, der Anpassung und der Weitergabe des Modells. Wenn du dich für ein Modell entscheidest, solltest du dich daher im Vorfeld darüber informieren, inwieweit dir eine Lizenz eine kommerzielle Nutzung erlaubt oder die Veröffentlichung deiner eigenen Anpassungen erfordert. Repositories wie Hugging Face oder GitHub zeigen dir den Lizenztyp in der Regel an.
Dass Sprachmodelle an AGB geknüpft sind, ist übrigens kein exklusives Problem von On-Premise Modellen: Auch bei cloudbasierten Modellen stimmst du durch die Verwendung den entsprechenden AGB zu. Gerade bei Bildgeneratoren erhältst du oft nur eingeschränkte Rechte an den erzeugten Motiven.
Schnellüberblick: Was erlauben dir gängige Lizenzmodelle?
Diese Lizenzen erlauben dir am meisten: Apache 2.0, MIT, BSD und CC0
Permissive Open-Source-Lizenzen sind am freizügigsten und gewähren dir vollständige Nutzungsfreiheit. Das bedeutet, sie erlauben dir als Medienunternehmen, das Modell auch kommerziell zu nutzen und zu diesem Zweck zu verändern, es weiterzuverbreiten und das angepasste Modell teilweise sogar zu patentieren (Apache 2.0).
Lizenzen, die dir fast alles erlauben, solange du deine Arbeit teilst: GNU GPL v3, AGPL v3 und CC-SA
Copyleft-Lizenzen sind freie Lizenzen, die die Nutzung, Modifikation und die kommerzielle Verbreitung erlauben. Da sie verlangen, die weiterentwickelten Werke unter der gleichen freien Lizenz zu veröffentlichen, eignen sie sich besonders gut für die Entwicklung eines offenen Ökosystems, bei dem alle Interessierten von den Beiträgen profitieren.
Mehr oder weniger freie Lizenzen: Creative-Commons-Lizenzen (CC 4.0)
Creative-Commons-Lizenzen gibt es nicht nur für Bilder, Texte und Datensätze, sondern auch für KI-Modelle. Was sie erlauben, zeigen dir die angehängten Kürzel. Weil diese von den Entwickler:innen modular kombiniert werden, um dir Aufschluss darüber zu geben, wie du sie verwenden darfst, geben wir dir hier eine kleine Übersicht:
- CC BY steht für „by“. Du darfst sie nach Nennung des Urhebers benutzen.
- CC NC bedeutet „Non-Commercial“. Sie erlauben dir, sie für nicht-kommerzielle Zwecke zu nutzen.
- CC SA steht für „ShareAlike“ und kommt einer Copyleft-Lizenz gleich.
- CC ND ist kurz für „NoDerivatives“ und lässt dich das Modell nur ohne Weiterbearbeitung frei nutzen.
Diese Lizenzen kommen mit Bedingungen: Meta, NVIDIA, OpenRAIL
Restriktive Lizenzen sind speziell im KI-Bereich entwickelte Open-Source-Lizenzen, die dir Modelle frei zugänglich machen, sofern du bei ihrer Nutzung beispielsweise nicht-kommerzielle Forschung betreibst oder ethisch verantwortungsvolle kommerzielle Zwecke verfolgst.
Ein Beispiel für eine nicht-kommerzielle Forschungslizenz ist die NVIDIA Source Code License – NC, die dir zum Experimentieren frei zur Verfügung steht.
Beispiele für Responsible AI Licenses (RAIL), also für Lizenzen, die verantwortungsvolle Nutzung ihrer Modelle festlegen, sind Versionen der OpenRAIL-M- oder Meta-LLaMA-2-Community-Lizenzen.
Unternehmenseigene Lizenzen erlauben dir für den lokalen Gebrauch keine Eigeninitiative und sind meist kostenpflichtige Enterprise-Lösungen
Proprietäre Lizenzen sind nicht offen und selten frei zum Download verfügbar. Sie gewähren dir meist die einfache Nutzung der Modelle über eine Web-Schnittstelle (API) über einen Endnutzervertrag (EULA). Diese Modelle werden lokal betrieben und meist speziell für die Bedürfnisse deines großen Unternehmens gegen eine Lizenzgebühr angepasst, wobei die genauen Absprachen mit dem Anbieter erfolgen.
Worauf solltest du in der Medienpraxis achten?
Lizenzen für KI-Modelle sind vielfältig. Essenziell ist deshalb Detailwissen, das sich dein Medienhaus vor dem Einsatz aneignen sollte. Mögliche Anwendungsverbote oder Moderationspflichten musst du genauso beachten wie korrekte Herkunfts- und Urheberangabe des Systems und Daten-Compliance. Wenn du dich nicht an die Lizenzauflagen hältst, riskierst du neben dem Verlust der Nutzungsrechte auch weitere Konsequenzen – sowohl im Hinblick auf juristische Prozesse als auch auf deine eigene Unternehmensreputation.
Daher solltest du immer prüfen,
- ob du das Modell intern bearbeiten, weiterentwickeln oder in bestehende Workflows und Webservices integrieren darfst.
- ob du deine Änderungen und Ergebnisse offenlegen musst und welche Beschränkungen es bei der Weitergabe an Dritte gibt.
- ob du das Modell für kommerzielle Projekte verwenden darfst oder eine kostenpflichtige Lizenz erforderlich ist.
- inwiefern Updates und Support geregelt sind.
- ob bestimmte Use-Cases ausgeschlossen sind. Dazu gehören beispielsweise Deepfakes, die ein besonders heikles Thema darstellen.
- ob du den KI-Output überwachen, kontrollieren oder filtern musst, bevor du ihn veröffentlichen darfst.
- ob du die ursprünglichen Entwickler:innen und dich für deine Anpassungen nennen musst oder darfst.
- welche Daten du verarbeiten darfst und wie du sicherstellst, dass Datenschutz und Urheberrecht eingehalten werden.
- welche Konsequenzen dir im Falle eines Lizenzbruchs drohen.
KI.M-Praxistipp: FAQ für gängige Lizenztypen von KI-Modellen
Als Medienschaffender solltest du dir vor der lokalen KI-Installation die folgenden Fragen stellen:
1. Welche KI-Lizenz brauche ich für kommerzielle Nutzung in Medienhäusern?
Für kommerzielle On-Premise-AI-Modelle sind permissive Lizenzen ideal: Apache 2.0, MIT, BSD oder CC0. Diese KI-Lizenzen für Medienunternehmen erlauben vollständige Nutzungsfreiheit ohne Einschränkungen. Vermeide explizit NC (Non-Commercial) Lizenzen wie CC-NC-ND, Meta AI oder NVIDIA.
2. Kann ich mein lokales KI-Modell an Unternehmensanforderungen anpassen?
Ja, wenn du KI-Modelle on premise betreibst, erlauben diese Lizenzen Modifikationen: Apache 2.0, MIT, BSD, GNU GPL oder CC-Lizenzen (außer CC-ND). Du kannst Finetuning und LoRA-Anpassungen für deinen spezifischen Medien-Workflow vornehmen.
3. Darf ich mein angepasstes KI-Modell weiterverkaufen?
Apache 2.0, MIT, BSD und CC0 erlauben dir das ohne Offenlegungspflicht. Bei Apache vs GPL Lizenz KI ist der Unterschied: GPL erfordert Quellcode-Veröffentlichung, Apache 2.0 bietet dir sogar eine Patentierungslizenz für dein Werk.
4. Wie schütze ich mein KI-Setup als Betriebsgeheimnis?
Wenn du KI-Modelle selbst betreibst für Datenschutz, vermeide Copyleft-Lizenzen (GPL, AGPL, CC-SA). Setze auf Apache 2.0, MIT, BSD oder proprietäre Lizenzen für maximalen Schutz deiner Unternehmensdaten.
5. Welche Vorteile bietet die lokale KI-Installation gegenüber Cloud-APIs?
On-Premise-KI-Modelle bieten dir vollständige Datenkontrolle, DSGVO-Compliance ohne externe Server, keine Abhängigkeit von Internet-Verbindungen und langfristige Planbarkeit für dein Medienhaus.
6. Was muss ich bei KI-Lizenzen rechtlich beachten?
Prüfe immer: kommerzielle Nutzungsrechte, Moderationspflichten für KI-Output, Attribution der Entwickler:innen, Daten-Compliance und Use-Case-Verbote. Verstöße gegen Lizenzauflagen können rechtliche und Reputationsrisiken für dein Medienunternehmen bedeuten.
7. Welche KI-Lizenz ist am flexibelsten für Medienhäuser?
Apache 2.0 bietet dir die breitesten Anwendungsmöglichkeiten: kommerzielle Nutzung, Modifikationen, Weiterverkauf, Patentschutz und keine Offenlegungspflicht. Ideal also für rechtssichere On-Premise-KI-Lösungen in der Medienbranche. Ist das gewünschte Modell nicht unter Apache 2.0 lizenziert, bieten andere permissive Lizenzen wie MIT, BSD oder CC0 eine gute Alternative, allerdings ohne Patentschutz.
Dieser Beitrag gibt eine Einschätzung zur strategischen KI-Einführung, ersetzt aber keine individuelle Beratung für dein spezifisches Unternehmen.
Bei der Erstellung des Beitragsbildes sowie des Textes kam generative Künstliche Intelligenz unterstützend zum Einsatz.