LG München I: Urheberrechtsschutz bei KI-Trainingsdaten

Das Landgericht München I hat mit Urteil vom 11. November 2025 (Az.: 42 O 14139/24) entschieden, dass die Vervielfältigung urheberrechtlich geschützter Werke zum Training von Künstlicher Intelligenz nicht ohne Weiteres durch gesetzliche Schrankenbestimmungen gerechtfertigt ist. In dem Rechtsstreit nahm eine Verwertungsgesellschaft die Betreiber eines weit verbreiteten KI-Chatbots auf Unterlassung, Auskunft und Schadensersatz in Anspruch, nachdem der Chatbot bekannte deutsche Liedtexte in veränderter Form ausgegeben hatte.

Sachverhalt: KI-Chatbot gibt bekannte Liedtexte aus

Die Klägerin, eine Verwertungsgesellschaft, nimmt die Beklagten als Betreiber von Sprachmodellen und darauf basierenden Chatbots wegen Verletzung von Urheber- und Persönlichkeitsrechten an neun verschiedenen Liedtexten in Anspruch. Bei den betroffenen Werken handelt es sich um populäre deutsche Liedtexte wie „Atemlos“ von Kristina Bach, „36 Grad“ von Thomas Eckart, Inga Humpe, Peter Plate und Ulf Leo Sommer, „Bochum“ und „Männer“ von Herbert Grönemeyer, „Über den Wolken“ von Reinhard Mey, „Junge“ von Jan Vetter sowie drei Texte von Rolf Zuckowski.

Die Beklagten gehören zu einer US-amerikanischen Unternehmensgruppe, die Technologien der generativen Künstlichen Intelligenz entwickelt, betreibt und lizenziert. Die Beklagte zu 1 mit Sitz in Irland bietet seit dem 14. Dezember 2023 den Chatbot der Unternehmensgruppe für Nutzer im Europäischen Wirtschaftsraum an. Die Beklagte zu 2 mit Sitz in den USA hatte diesen Dienst seit dem Launch am 30. November 2022 bis zur Übernahme durch die Beklagte zu 1 angeboten. Den Chatbot und die zugrundeliegenden KI-Sprachmodelle stellen die Beklagten auf Servern an verschiedenen Standorten im Europäischen Wirtschaftsraum bereit, darunter auch in Deutschland.

Im Rahmen des Verfahrens wurde festgestellt, dass die streitgegenständlichen Liedtexte als Outputs in veränderten Fassungen wiedergegeben wurden. Die Prozessbevollmächtigten der Klägerin nutzten als Prompts Fragen wie „Wie lautet der Text von [Liedtitel]“, „Von wem stammt der Text“, „Wie lautet der Refrain von [Liedtitel]“ sowie Aufforderungen zur Nennung der ersten und zweiten Strophe. In einem Fall wurde der Refrain des Liedes „36 Grad“ wortwörtlich wiedergegeben. Die Klägerin hatte zudem bereits im Jahr 2022 ihren Berechtigungsvertrag angepasst, um sich die Befugnis zur Erklärung eines Nutzungsvorbehalts gemäß § 44b UrhG einräumen zu lassen, und diesen Vorbehalt auf ihrer Website sowie in ihren Tarifbedingungen erklärt.

Rechtliche Bewertung: Memorisation von Trainingsdaten als urheberrechtliche Vervielfältigung

Das Gericht stellte zunächst fest, dass die Klage zulässig und überwiegend begründet ist. Der Klägerin stehen die geltend gemachten Ansprüche aufgrund der Verletzung von urheberrechtlichen Nutzungsrechten zu, während die persönlichkeitsrechtlichen Ansprüche abzuweisen waren. Die internationale Zuständigkeit gegenüber der Beklagten zu 1 folgt aus Art. 7 Nr. 2 EuGVVO, gegenüber der Beklagten zu 2 aus § 32 ZPO.

Memorisation: Das Auswendiglernen von Trainingsdaten

Ein zentraler Aspekt der Entscheidung ist die sogenannte Memorisation (Memorierung) von Trainingsdaten durch KI-Modelle. Das Gericht stützte sich hierbei auf informationstechnische Forschung, wonach Trainingsdaten in Modellen enthalten sein können und sich als Outputs extrahieren lassen. Eine solche Memorisierung liegt vor, wenn die unspezifischen Parameter beim Training dem Trainingsdatensatz nicht nur Informationen entnehmen, sondern sich in den nach dem Training spezifizierten Parametern eine vollständige Übernahme der Trainingsdaten findet.

Als Ursache für die Memorisation, die vor allem bei großen Modellen auftritt, wird insbesondere das mehrfache Auftreten eines Trainingsdatums im Trainingssatz vermutet. Das Gericht stellte fest, dass die streitgegenständlichen Texte nach Überzeugung der Kammer im Modell enthalten waren.

Der Nachweis der Memorisation erfolgte durch einen Abgleich der Trainingsdaten mit den Outputs bei Verwendung einfacher Prompts und hinreichender Textlänge. Die Klägerin hatte die streitgegenständlichen Liedtexte durch sehr einfach gehaltene Prompts wie „Wie lautet der Text von [Liedtitel]“ oder „Bitte nenne mir auch die 1. Strophe“ aus dem Modell abgerufen. Ausweislich der Anlage K 2 waren die Liedtexte dadurch deutlich wiedererkennbar in den Outputs wiedergegeben worden.

Das Gericht wies das Argument der Beklagten zurück, die einfache Prompts hätten die Outputs „provoziert“. Angesichts der Komplexität und Länge der Liedtexte kann der Zufall als Ursache für die Wiedergabe ausgeschlossen werden. Die einfach gehaltenen Prompts dienten lediglich dem Nachweis der Memorisation, nicht deren Erzeugung.

Memorisation als Vervielfältigung nach § 16 UrhG

Das Gericht qualifizierte die Memorisation der streitgegenständlichen Liedtexte in den Modellen als Vervielfältigung gemäß § 16 UrhG. Für die urheberrechtliche Vervielfältigung ist es unerheblich, wie die Memorisierung im Einzelnen funktioniert. Es ist auch unerheblich, ob von einem Speichern oder Kopieren der Trainingsdaten gesprochen wird, oder ob das Modell in seinen Parametern lediglich reflektiert, was es basierend auf dem gesamten Trainingsdatensatz erlernt habe. Entscheidend ist, dass die Liedtexte, die als Trainingsdaten dienten, im Modell reproduzierbar enthalten und somit verkörpert sind.

Das Vervielfältigungsrecht nach § 16 UrhG setzt Art. 2 InfoSoc-RL um und ist weit auszulegen. Eine Vervielfältigung ist nicht nur eine identische Reproduktion, sondern auch eine Festlegung des Werks in veränderter Form. Unerheblich ist zudem die Dauer der Vervielfältigung. Die in den Modellen körperlich festgelegten streitgegenständlichen Liedtexte können den menschlichen Sinnen mittelbar wahrnehmbar gemacht werden, was für eine Vervielfältigung ausreicht.

Keine Rechtfertigung durch § 44b UrhG

Der zentrale rechtliche Streitpunkt betraf die Frage, ob die Vervielfältigungen in den KI-Modellen durch die Schrankenbestimmung des § 44b UrhG (Text and Data Mining) gerechtfertigt sind. Das Gericht verneinte dies mit ausführlicher Begründung.

Zwar unterfallen Sprachmodelle wie die streitgegenständlichen Modelle grundsätzlich dem Anwendungsbereich der Text-and-Data-Mining-Schranken. Die Vorschriften decken jedoch lediglich erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus in einer ersten Phase ab, nicht aber weitergehende Vervielfältigungen im Modell in einer zweiten Phase. Werden mit dem Training nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stellt dies kein Text and Data Mining im Sinne der Vorschrift dar.

Das Gericht betonte ausdrücklich: Die Memorierung der streitgegenständlichen Liedtexte überschreitet eine reine Auswertung und ist daher kein bloßes Text and Data Mining. Die Liedtexte als Trainingsdaten wurden nicht allein ausgewertet, sondern vollständig in die Parameter des Modells übernommen, was in die Verwertungsinteressen der Urheber eingreift.

Das Gericht stützte sich dabei auf den eindeutigen Wortlaut der unionsrechtlichen Regelung in Art. 4 Abs. 1 DSM-RL, der „zum Zwecke des Text and Data Mining vorgenommene Vervielfältigungen“ voraussetzt. Vervielfältigungen im Modell dienen aber nicht der weiteren Datenanalyse, weshalb die Schrankenregelung hierfür nicht als Legitimationsgrundlage in Betracht kommt. Auch § 44b Abs. 2 UrhG verlangt eine zweckgerichtete Vervielfältigung, die für das Text and Data Mining erforderlich sein muss. Die Klägerin hatte zudem einen wirksamen Nutzungsvorbehalt nach § 44b UrhG erklärt, was die Anwendung der Schrankenbestimmung ohnehin ausschließt.

Konsequenzen für die Praxis: Klare Anforderungen für KI-Anbieter

Das Urteil hat weitreichende praktische Konsequenzen für Anbieter von KI-Sprachmodellen und generativer KI-Systeme.

Für KI-Anbieter und Entwickler

Das Urteil verdeutlicht, dass das Training von KI-Sprachmodellen mit urheberrechtlich geschützten Werken nicht automatisch durch die Text-and-Data-Mining-Schranke des § 44b UrhG gedeckt ist. Anbieter müssen sicherstellen, dass sie entweder über entsprechende Lizenzen verfügen oder dass die verwendeten Werke nicht unter einen wirksamen Nutzungsvorbehalt fallen. Die bloße Behauptung, dass die Nutzung der technologischen Entwicklung diene, reicht als Rechtfertigung nicht aus.

Besonders relevant ist die Entscheidung für das Phänomen der Memorisation: Wenn ein KI-Modell Trainingsdaten so speichert, dass sie durch einfache Prompts wieder abrufbar sind, stellt dies eine urheberrechtliche Vervielfältigung dar. Das Gericht wies darauf hin, dass sollte eine Memorisierung der Trainingsdaten nach dem Stand der Technik nicht verhinderbar sein, ein Training von Modellen mit urheberrechtlich geschützten Trainingsdaten nicht durch die geltende Text-and-Data-Mining-Schranke gedeckt ist. Rechtspolitisch wird zwar die Einführung einer neuen Schranke diskutiert, die ein solches Training deckt und eine Vergütung der Urheber beinhaltet, geltendes Recht ist dies jedoch nicht.

Das Gericht wies zudem das Argument der Beklagten zurück, dass eine Verurteilung unverhältnismäßig sei, da dies zur Einstellung des Angebots in Deutschland führen würde. Es betonte jedoch, dass die Klägerin als Verwertungsgesellschaft nicht nur ein Interesse an Abschluss von Lizenzverträgen zu angemessenen Bedingungen hat, sondern auch ein Interesse an der Unterlassung bei unberechtigter Nutzung.

Für Rechteinhaber und Verwertungsgesellschaften

Für Rechteinhaber und Verwertungsgesellschaften stärkt das Urteil die Position bei der Durchsetzung von Urheberrechten gegenüber KI-Anbietern. Die Erklärung eines Nutzungsvorbehalts nach § 44b UrhG ist ein wirksames Instrument, um die ungenehmigte Nutzung von Werken zum Training von KI-Modellen zu verhindern. Das Urteil zeigt, dass Verwertungsgesellschaften aktivlegitimiert sind, Unterlassungsansprüche bei Verletzungen der von ihnen wahrgenommenen Rechte geltend zu machen.

Der Nachweis der Memorisation kann durch einen Abgleich der Trainingsdaten mit den Outputs bei Verwendung einfacher Prompts erfolgen. Dies bietet Rechteinhabern eine praktische Möglichkeit, Urheberrechtsverletzungen durch KI-Systeme nachzuweisen.

Für Betreiber von KI-Systemen

Betreiber (Nutzer) von KI-Systemen sollten sich bewusst sein, dass die Ausgabe urheberrechtlich geschützter Inhalte durch KI-Chatbots Urheberrechte verletzen kann. Das Urteil betrifft zwar primär die Anbieter der KI-Systeme, zeigt jedoch, dass die urheberrechtlichen Grundsätze auch im Kontext der Nutzung generativer KI Anwendung finden.

Gerichtliche Entscheidungen geben eine Orientierung, ersetzen aber keine Prüfung des konkreten Einzelfalls. Weitere Informationen zur individuellen rechtlichen Unterstützung finden Sie hier:
Leistungen und FAQ im KI-Recht➔

Alle weiteren relevanten Entscheidungen deutscher Gerichte zum Thema Künstliche Intelligenz sind hier chronologisch aufgelistet:
Übersicht zur KI-Rechtsprechung➔

LG München I: Urheberrechtliche Grenzen beim Training von KI-Sprachmodellen

Sachverhalt: KI-Chatbot gibt bekannte Liedtexte aus

Rechtliche Bewertung: Memorisation von Trainingsdaten als urheberrechtliche Vervielfältigung

Memorisation: Das Auswendiglernen von Trainingsdaten

Memorisation als Vervielfältigung nach § 16 UrhG

Keine Rechtfertigung durch § 44b UrhG

Konsequenzen für die Praxis: Klare Anforderungen für KI-Anbieter

Für KI-Anbieter und Entwickler

Für Rechteinhaber und Verwertungsgesellschaften

Für Betreiber von KI-Systemen

KI-Kennzeichnungspflicht: Müssen alte KI-Inhalte nachträglich gekennzeichnet werden?

LG Frankfurt zum Schutzumfang KI-bearbeiteter Produktfotos

LG Berlin II: Keine Markenbenutzung bei KI-Suchergebnissen von Google

LG München I: Google haftet für rechtsverletzende KI-Suchergebnisse