In einem lang erwarteten Urteil hat das Landgericht Hamburg ein erstes indikatives Urteil zu den Grenzen des Urheberrechts im digitalen Zeitalter gefällt. Der Fall dreht sich um die Erstellung eines Datensatzes für das Training künstlicher Intelligenz (KI) und berührt zentrale Fragen des Urheberrechts im Kontext der KI-Forschung. Das Gericht entschied zugunsten eines gemeinnützigen Forschungsnetzwerks und stärkte damit die Position von Forschungseinrichtungen im Bereich der KI-Entwicklung.
Sachverhalt
Der beklagte Verein, das Forschungsnetzwerk LAION (Large-Scale Artificial Intelligence Open Network), hatte einen umfangreichen Datensatz mit 5,85 Milliarden Bild-Text-Paaren erstellt und öffentlich zur Verfügung gestellt. Dieser Datensatz, der für das Training von KI-Modellen genutzt werden kann, enthält URLs zu im Internet abrufbaren Bildern sowie Beschreibungen dieser Bilder. Im Rahmen der Erstellung dieses Datensatzes wurde auch ein urheberrechtlich geschütztes Foto des Klägers heruntergeladen, analysiert und mit seinen Metadaten in den Datensatz aufgenommen. Der Kläger sah darin eine Verletzung seiner Urheberrechte und klagte auf Unterlassung.
Entscheidung des Gerichts
Das Landgericht Hamburg wies die Klage ab und entschied, dass die Vervielfältigung des streitgegenständlichen Fotos durch die Schrankenregelung des § 60d UrhG (Text- und Data-Mining für Zwecke der wissenschaftlichen Forschung) gedeckt ist.
In seiner Begründung führte das Gericht aus, dass die Erstellung des Datensatzes als Text- und Data-Mining im Sinne des § 60d Abs. 1 UrhG zu qualifizieren sei. Das Gericht definierte Text- und Data-Mining als “automatisierte Analyse von digitalen Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen” (Rn. 71). Im vorliegenden Fall diente die Vervielfältigung dazu, “Korrelationen” zwischen Bildinhalt und Bildbeschreibung zu finden.
Entscheidend war für das Gericht, dass der Beklagte die Voraussetzungen des § 60d UrhG erfüllte, insbesondere dass er nicht-kommerzielle wissenschaftliche Forschung betreibt. Das Gericht legte den Begriff der wissenschaftlichen Forschung weit aus und stellte fest:
“Der Begriff der wissenschaftlichen Forschung ist, indem er bereits das methodisch-systematische ‘Streben’ nach neuen Erkenntnissen ausreichen lässt, nicht so eng zu verstehen, dass er nur die unmittelbar mit der Gewinnung von Erkenntnisgewinn verbundenen Arbeitsschritte erfassen würde; vielmehr genügt es, dass der in Rede stehende Arbeitsschritt auf einen (späteren) Erkenntnisgewinn gerichtet ist […]. Insbesondere setzt der Begriff der wissenschaftlichen Forschung auch keinen späteren Forschungserfolg voraus.” (Rn. 113)
Das Gericht betonte, dass die Erstellung des Datensatzes als grundlegender Arbeitsschritt mit dem Ziel des späteren Erkenntnisgewinns zu sehen sei. Die Tatsache, dass der Datensatz kostenfrei veröffentlicht und damit auch Forschenden im Bereich künstlicher neuronaler Netze zur Verfügung gestellt wurde, genügte dem Gericht als Nachweis für die Forschungsabsicht (Rn. 114).
Interessanterweise hielt das Gericht fest, dass es unerheblich sei, ob der Datensatz auch von kommerziellen Unternehmen zum Training ihrer KI-Systeme genutzt wird, da “auch die Forschung kommerzieller Unternehmen noch Forschung – wenn auch nicht als solche nach §§ 60c f. UrhG privilegiert – ist” (Rn. 114 a. E.).
Obiter Dictum zu § 44b UrhG
Obwohl für die Entscheidung nicht ausschlaggebend, äußerte sich das Gericht auch zur Anwendbarkeit des § 44b UrhG (allgemeine Schrankenregelung für Text- und Data-Mining). Besonders bemerkenswert sind die Ausführungen zur Frage der Maschinenlesbarkeit eines Nutzungsvorbehalts:
Das Gericht neigt dazu, auch einen in “natürlicher Sprache” verfassten Nutzungsvorbehalt als “maschinenverständlich” im Sinne des § 44b Abs. 3 S. 2 UrhG anzusehen. Dies steht im Gegensatz zur überwiegenden Auffassung im Schrifttum (Rn. 102). Wir haben hierzu auch bereits berichtet, vgl. unsere News 28.11.2023.
Das LG Hamburg argumentiert, dass die Frage, ob ein in natürlicher Sprache erklärter Vorbehalt als “maschinenverständlich” gelten kann, stets in Abhängigkeit von der zum jeweiligen Werknutzungszeitpunkt bestehenden technischen Entwicklung zu beantworten sei (Rn. 102). Zur Untermauerung dieser Ansicht verweist das Gericht auf Art. 53 Abs. 1 lit. c des AI Act, wonach Anbieter von KI-Systemen mit allgemeinem Verwendungszweck über eine Strategie zur “Ermittlung und Einhaltung eines […] Rechtsvorbehalts auch durch modernste Technologien” verfügen müssen (Rn. 103).
Fazit
Das Urteil des LG Hamburg stärkt die Position von Forschungseinrichtungen und Unternehmen, die sich mit der Entwicklung von KI-Systemen befassen. Es zeigt, dass die Erstellung von Trainingsdatensätzen für KI unter bestimmten Voraussetzungen urheberrechtlich zulässig sein kann.
Insbesondere ob die Ausführungen des Gerichts zur Schranke des § 44b UrhG in den höheren Instanzen Bestand haben werden, ist noch nicht abzusehen. Das Gericht lässt bei seinem obiter dictum einige Fragen offen. Zudem verkennt das Gericht, dass die Schranke des § 44b UrhG nicht nur für KI-Anbieter gilt – für die dann aber im Rahmen des § 44b UrhG strengere Regeln gelten würden, als Personen die Text-und Data-Mining ohne den Einsatz von KI betreiben. Für eine tatsächlich belastbare Entscheidung in diesem Bereich fehlt eine Auseinandersetzung zu zentralen Fragen des Scrapings gänzlich – wie z. B. eine Auseinandersetzung damit, wie Scraping im Rahmen des Text- und Data-Minings üblicherweise betrieben wird. Denn selten kommt bereits hier KI zum Einsatz. Vielmehr im HTML-Code der Zielseite gezielt nach bestimmten HTML-Tags wie <p> gesucht, um deren Inhalte abzurufen. Eine inhaltliche Auseinandersetzung mit dem Inhalt dieser Tags ist an dieser Stelle noch nicht zwingend. Wir empfehlen daher dringend, dass sofern ein Nutzungsvorbehalt im Rahmen des § 44b Abs. 3 UrhG erklärt werden soll, dies vorsorglich sowohl im Quellcode, der „robots.txt“-Datei der Homepage, als auch in den Nutzungsbedingungen erfolgen sollte.
Trotz dieses für die KI-Forschung positiven Urteils bleibt die rechtliche Lage komplex. Unternehmen sollten ihre Praktiken im Bereich des Text- und Data Minings sorgfältig prüfen und gegebenenfalls anpassen, um urheberrechtliche Risiken zu minimieren. Eine genaue Dokumentation der Forschungszwecke und -methoden kann im Streitfall von Vorteil sein.
Wenn Sie Fragen zur Erklärung des Nutzungsvorbehalts nach § 44b UrhG haben, sprechen Sie uns gerne an.