Guidelines for Text and Data Mining for research purposes in Germany completed!

The recently published “Guidelines zum Text und Data Mining für Forschungszwecke in Deutschland” describe under which conditions text and data mining may be carried out for scientific purposes and what risks exist. An online workshop, “Urheberrechtliche Fragestellungen bei der Gestaltung von Dienstleistungen zum Text und Data Mining” will take place on April 25th to address copyright issues in designing services to support text and data mining.

Symbolbild Softwarecode. In Measure S-7 wird an Services gearbeitet, die die Anwendung von Text-und-Data-Mining-Verfahren in den Ingenieurwissenschaften unterstützen sollen. Reto Scheiwiller@Pixabay

Guidelines zum Text und Data Mining für Forschungszwecke in Deutschland

Gute Nachrichten aus Measure S-7: Ende Oktober 2022 wurde mit der Veröffentlichung der „Guidelines zum Text und Data Mining für Forschungszwecke in Deutschland“ das Arbeitspaket S-7-2 abgeschlossen.

Im Rahmen der Guidelines wird beschrieben, unter welchen Bedingungen Text und Data Mining (TDM) zu wissenschaftlichen Zwecken bei wissenschaftlichen Publikationen auf der Basis von Schrankenregelungen und/oder Verträgen durchgeführt werden darf und welche Risiken bestehen. Zudem wird dargestellt, wie Publikationen für TDM genutzt werden können, wenn weder eine gesetzliche Schrankenregelung greift noch eine vertragliche Erlaubnis gegeben ist.

Es hat sich gezeigt, dass mit der Umsetzung der DSM-Richtlinie in deutsches Recht zum 07.06.2021 ein verlässlicher Rahmen für TDM bei wissenschaftlicher Literatur geschaffen wurde, selbst wenn es sich um Publikationen von Verlagen mit Sitz außerhalb der EU handelt:  Wenn alle zum TDM gehörenden Handlungen in Deutschland durchgeführt werden (Vervielfältigung, Speichern, automatisierte Analyse, soweit zulässig Veröffentlichung und Online-Bereitstellung, Archivierung), dann ist TDM auf Basis der Schrankenregelungen immer möglich, sofern der Zugang zu den Textpublikationen nicht auf einem vor dem 01.03.2018 abgeschlossenen Lizenzvertrag beruht, der TDM explizit verbietet oder dessen Bedingungen als Verbot auszulegen sind. In welchem Umfang TDM durchgeführt werden darf, richtet sich nach der im Zeitpunkt der Durchführung des TDM geltenden Schrankenregelung (vom 01.03.2018 bis 07.06.2021 gilt § 60d UrhG alte Fassung, ab dem 07.06.2021 gelten die neuen Fassungen des §§ 60d, 44b UrhG).

Die DSM-Richtlinie, die verbindlich in allen EU-Mitgliedstaaten in das jeweilige Landesrecht umzusetzen ist, lässt den Gesetzgebern der Mitgliedstaaten an verschiedenen Stellen etwas Spielraum bei der Umsetzung, so dass die Rechtslage in den Mitgliedsstaaten auch innerhalb Europas von der hier dargestellten Rechtslage abweichen kann.

Seit dem 07.06.2021 darf TDM auch zu kommerziellen Zwecken durchgeführt werden, so dass auch Forschungsprojekte mit kommerziellen Partnern sich auf diese Schrankenregelungen berufen dürfen, auch wenn der Rahmen etwas enger ist als für die nichtkommerzielle Forschung.

Sollen unter CC-Lizenzen der Versionen 3.0 DE, 3.0 Unported und 4.0 International veröffentlichte Publikationen in das Textkorpus aufgenommen werden, dann ist TDM in der Regel möglich, soweit die vom Lizenzgeber ausgewählten Einschränkungen der CC-Lizenz beachtet werden. Vorsicht ist bei technischen Schutzmaßnahmen geboten, oder wenn die CC-lizenzierten Werke digitalen Datenbanken entnommen werden sollen.

Unabhängig davon, ob TDM auf der Basis von Verträgen oder Schrankenregelungen erlaubt ist, können die Publikationen in „abgeleitete Textformate“ umgewandelt oder im Rahmen der freien Benutzung nach § 23 Abs. 1 S. 2 UrhG für TDM aufbereitet und für TDM genutzt werden.

Mit Umsetzung der DSM-Richtlinie in deutsches Recht zum 07.06.2021 ist es neben Forschenden jetzt explizit auch Forschungsorganisationen, wissenschaftlichen Bibliotheken und anderen Kulturerbeeinrichtungen erlaubt TDM zu nichtkommerziellen wissenschaftlichen Zwecken durchzuführen und Forschende dabei zu unterstützen. In den Guidelines wird nicht beschrieben, wie Infrastruktureinrichtungen Dienstleistungen gestalten können, um Forschende bei der Nutzung von Verlagspublikationen zum Text und Data Mining zu unterstützen: Die Verlagspublikationen werden meist durch die Infrastruktureinrichtungen lizenziert und es stellt sich die Frage, ob und in welcher Form die Infrastruktureinrichtungen selbst die lizenzierten Verlagspublikationen für Text und Data Mining aufbereiten, als Textkorpus vorhalten können und welchen Forschenden sie das Textkorpus zur Verfügung stellen dürfen und welche urheberrechtlichen Aspekte dabei zu beachten sind.

Online-Workshop zum Thema “Urheberrechtliche Fragestellungen bei der Gestaltung von Dienstleistungen zum Text und Data Mining”

Am 25. April 2023 von 10-12 und 14-16 Uhr findet daher unter der Leitung von Dr. Maximilian Vonthien, LL.M. der Kanzlei CMS zur Ergänzung der Ende Oktober publizierten Guidelines ein Online-Workshop zum Thema “Urheberrechtliche Fragestellungen bei der Gestaltung von Dienstleistungen zum Text und Data Mining” statt. Die Teilnahme ist nach einer Registrierung unter https://nfdi4ing.de/ws-elsa-tdm möglich.

Zielgruppe: Die Veranstaltung ist offen für alle Interessierten, insbesondere für Forschende und Aktive in Infrastruktureinrichtungen, die Dienstleistungen zum Text und Data Mining für Forschende aufbauen.

Ausblick

Die weiteren Planungen in der Measure S-7 sehen vor, zeitnah Open-Access-Artikel aus Zeitschriften des MDPI-Verlags für TDM-Analysen bereitzustellen. Eine entsprechende Vereinbarung mit dem Verlag, die die Bereitstellung im Rahmen des NFDI4Ing-Projekts erlaubt, existiert bereits. An der technischen Umsetzung wird derzeit gearbeitet. Für die Bereitstellung weiterer Literatur ist geplant, auch auf den Ergebnissen des oben genannten Workshops aufzubauen. Ein Anwendungsbeispiel, das eine Suche über die geharvestete Literatur ermöglichen soll, befindet sich derzeit in der Konzeptionsphase.

Elke Brehm, TIB
Jens Freund, ULB Darmstadt