Methodik

Datenquellen und Tools

Datenverarbeitung & Reproduktion

Wie oben aufgeführt, verarbeitet das pkm_nrw auf Basis von Skripten eine Reihe verschiedener Datensätze, um die hier aufgerufene Monitoring-Website zu erstellen. Der gesamte Workflow zum Reproduzieren (M = manuell, nicht automatisiert) der hier dargestellten Ergebnisse kann wie folgt zusammengefasst werden:

  1. Nutzung des Betriebssystems Linux, manuell
  2. Installation von R, manuell
  3. Installation von RStudio, manuell
  4. Installation von Quarto und TinyTex (“quarto install tinytex” im Terminal ausführen), manuell
  5. Download des pkm_nrw-Quellcodes, manuell
  6. Beziehen eines API-Tokens für den Open Access Monitor, manuell
  7. Ggf. Änderung von “config.R” (erfasster Publikationszeitraum, etc.), manuell
  8. Ausführen des Skripts “run_all.R” (Downloads, Berechnungen und Website-Erstellung), manuell:
    1. Download aller definierten Publikationsmetadaten, welche (i) von Unpaywall indexiert sind (DOI vorhanden), (ii) den Crossref-Publikationstyp „journal-article“ haben, (iii) im Web of Science gelistet sind (Affiliationsdatenquelle), (iv) mindestens eine Korrespondenzautorenschaft an einer DH-NRW Einrichtung aufweisen und (v) im Zeitraum von 2014 bis 2023 veröffentlicht wurden
    2. Download des OpenAPC-Datensatzes
    3. Zuordnung von OpenAPC-Kostendaten zu Publikationsmetadaten mittels DOI
    4. Download von APC-Listenpreisen vom Directory of Open Access Journals und Zuordnung von Jahresquartal für die etwaige Umrechnung in Euro
    5. Download von quartalsweise gemittelten Wechselkursen von der Europäischen Zentralbank
    6. Bereinigung der Listenpreise durch das Umrechnen in Euro mittels historischer Wechselkurse und das Hinzufügen von 19% Mehrwertsteuer
    7. Die entstehenden angepassten Listenpreise überschätzen die tatsächlich gezahlten APCs im Mittel um den Faktor 0,96 und werden daher um diesen Wert korrigiert.
    8. Zuordnung von angepassten Listenpreisen mittels ISSN zu Publikationsmetadaten ohne OpenAPC-Kostendatum
    9. Schätzung der restlichen fehlenden Kostendaten nach qualitativer Analyse (v.a. Conference proceedings, daher 0€)
    10. Erstellung der Website pkm_nrw

Publikationen werden derzeit ab dem Jahr 2014 erfasst. Aufgrund der Datenqualität bezüglich Publikationskosten werden im pkm_nrw lediglich Kostendaten ab dem Jahr 2020 verarbeitet.

Einrichtungen der DH.NRW

In der folgenden Tabelle sind sämtliche Mitgliedshochschulen der DH.NRW aufgeführt. Da der Abruf der Publikationsmetadaten aus dem Open Access Monitor über die ROR ID der jeweiligen Einrichtung erfolgt, ist diese auch die kleinste Analyseeinheit.

Einrichtungen der DH.NRW
ROR ID Einrichtungsname Einrichtungstyp
04xfq0f34 Rheinisch-Westfälische Technische Hochschule Aachen Universität
02hpadn98 Universität Bielefeld Universität
04tsk2644 Ruhr-Universität Bochum Universität
041nas322 Rheinische Friedrich-Wilhelms-Universität Bonn Universität
01k97gp34 Technische Universität Dortmund Universität
04mz5ra38 Universität Duisburg-Essen Universität
024z2rq82 Heinrich-Heine-Universität Düsseldorf Universität
04tkkr536 FernUniversität in Hagen Universität
00rcxh774 Universität zu Köln Universität
00pd74e08 Universität Münster Universität
058kzsd48 Universität Paderborn Universität
02azyry73 Universität Siegen Universität
00613ak93 Bergische Universität Wuppertal Universität
00yq55g44 Universität Witten/Herdecke Universität
0189raq88 Deutsche Sporthochschule Köln Universität
04tqgg260 Fachhochschule Aachen Hochschule für angewandte Wissenschaften
00edvg943 Hochschule Bielefeld Hochschule für angewandte Wissenschaften
03vz3qc29 Evangelische Hochschule Rheinland-Westfalen-Lippe Hochschule für angewandte Wissenschaften
04x02q560 Hochschule Bochum Hochschule für angewandte Wissenschaften
03dv91853 Fachhochschule Dortmund Hochschule für angewandte Wissenschaften
00ftx0026 Hochschule Düsseldorf Hochschule für angewandte Wissenschaften
04p7ekn23 Westfälische Hochschule Gelsenkirchen Bocholt Recklinghausen Hochschule für angewandte Wissenschaften
001rdde17 Hochschule Hamm-Lippstadt Hochschule für angewandte Wissenschaften
04t5phd24 Fachhochschule Südwestfalen Hochschule für angewandte Wissenschaften
04wdt0z89 Hochschule Rhein-Waal Hochschule für angewandte Wissenschaften
024nr0776 Katholische Hochschule Nordrhein-Westfalen Hochschule für angewandte Wissenschaften
014nnvj65 Technische Hochschule Köln Hochschule für angewandte Wissenschaften
027b9qx26 Hochschule Niederrhein Hochschule für angewandte Wissenschaften
04eka8j06 Technische Hochschule Ostwestfalen-Lippe Hochschule für angewandte Wissenschaften
02nkxrq89 Hochschule Ruhr West Hochschule für angewandte Wissenschaften
00pv45a02 Fachhochschule Münster Hochschule für angewandte Wissenschaften
04m2anh63 Hochschule Bonn-Rhein-Sieg Hochschule für angewandte Wissenschaften
00txhpa83 Rheinische Fachhochschule Köln Hochschule für angewandte Wissenschaften
033jd5r25 Technische Hochschule Georg Agricola (THGA) Hochschule für angewandte Wissenschaften
03y02pg02 Hochschule für Musik Detmold Kunst- oder Musikhochschule
040d40q10 Kunstakademie Düsseldorf Kunst- oder Musikhochschule
04e1yzk82 Robert-Schumann-Hochschule Düsseldorf Kunst- oder Musikhochschule
03gf02c22 Folkwang Universität der Künste Kunst- oder Musikhochschule
05256tw11 Hochschule für Musik und Tanz Köln Kunst- oder Musikhochschule
00f2wje32 Kunsthochschule für Medien Köln Kunst- oder Musikhochschule
00ztzxf77 Kunstakademie Münster / Hochschule für Bildende Künste Kunst- oder Musikhochschule

Definition der Zugangstypen (Open bzw. Closed Access)

Die Definition der Zugangstypen folgt der des Open Access Monitors des Forschungszentrums Jülich (siehe OAM-Reports: „Publikationsaufkommen und -verteilung wissenschaftlicher Artikel im Kontext der Open-Access-Transformation“).

Artikel

Diamond Open Access

Dieser Typ des Open-Access-Publizierens entspricht weitestgehend dem im Folgenden genannten Gold Open Access, wobei im Gegensatz dazu bei Veröffentlichungen in Diamond-Open-Access-Zeitschriften bekannt ist, dass diese keine Article Processing Charges (APCs) von den Autorinnen und Autoren verlangen.1

Gold Open Access

Der goldene Typ des Open-Access-Publizierens bezeichnet die Erstveröffentlichung wissenschaftlicher Werke als Artikel in reinen Open-Access-Zeitschriften. Artikel und Zeitschrift sind i.d.R. mit einer entsprechenden Information über eine offene Lizenz versehen2.

Hybrid Open Access

Im Gegensatz zum goldenen Open Access findet hier die Erstveröffentlichung eines wissenschaftlichen Artikels in einer Zeitschrift statt, die grundlegend subskriptionsbasiert vorliegt. Durch die Zahlung einer Gebühr wird dieser Artikel Open Access zur Verfügung gestellt und mit einer entsprechenden Lizenzinformation versehen.

Green Open Access

Der grüne Typ des Open Access bezeichnet die zusätzliche (Zweit-)Veröffentlichung eines Artikels, der ursprünglich in einem Verlag oder einer Zeitschrift erschienen ist bzw. bei dieser eingereicht wurde. Die Zweitveröffentlichung auf einem institutionellen oder disziplinären Open-Access-Dokumentenserver oder Repositorium kann vorher, zeitgleich mit oder nachträglich zur Publikation im Verlag erfolgen. Weitere Unterschiede gibt es je nach Art des zweitveröffentlichten Artikels, wobei zwischen green submitted (eingereichte Manuskriptversion), green accepted (akzeptierte Manuskriptversion) und green published (Verlagsversion) unterschieden wird. Ist ein Artikel sowohl im Green als auch im Gold Open Access veröffentlicht worden, so wird im Open Access Monitor nur letztere Version gezählt und dem Artikel zugeschrieben. Artikel, die sowohl im Bronze wie auch Green Open Access veröffentlicht wurden, werden als Green Open Access klassifiziert. Es findet keine Mehrfachzuordnung eines Artikels statt.

Bronze Open Access

Bronzener Open Access steht für die frei zugängliche Verlagsversion, die jedoch im Gegensatz zum goldenen bzw. hybriden Open Access mit keinerlei Lizenzinformation versehen ist oder wo der freie Zugang nur für einen beschränkten Zeitraum möglich ist. Bronzener Open Access ist somit nur „free to read“ bzw. gratis für den lesenden Zugriff, ermöglicht aber keine Nachnutzung.

Closed Access

Der Artikel ist nicht Open Access, da keine frei verfügbare Version des Artikels gefunden werden konnte. Der lesende Zugang zum Artikel ist technisch i.d.R. auf einen zahlenden Kreis von Leserinnen und Lesern beschränkt.

Zeitschriften

Closed/Hybrid Access

Auf Ebene der Zeitschriften wird zwischen Closed/Hybrid, Diamond und Gold unterschieden. Der Zeitschriftentyp Closed/Hybrid bedeutet, dass Artikel in entsprechenden Zeitschriften nicht ausschließlich über Gold oder Diamond Open Access zugänglich sind. In der Regel befinden sich die Inhalte weit überwiegend bis vollständig hinter der Bezahlschranke.

Gold Open Access

Die aktuellen Jahrgänge dieses Zeitschriftentyps sind vollständig im Open Access zugänglich. Artikel und Zeitschrift sind i.d.R. mit einer entsprechenden Information über eine offene Lizenz versehen.

Diamond Open Access

Dieser Typ des Open Access entspricht dem oben genannten Gold Open Access, wobei über Zeitschriften mit Diamond Open Access anhand einschlägiger Quellen bekannt ist, dass diese keine Article Processing Charges (APCs) von Autorinnen und Autoren verlangen.

Verlage

Open Access

Ein Open-Access-Verlag veröffentlicht sämtliche Inhalte und alle Zeitschriften ausnahmslos im goldenen oder diamantenen Open Access unter einer offenen Lizenz.

Closed/Hybrid Access

Dies ist eine Kategorie für alle übrigen Verlagstypen.

Limitierungen/Einschränkungen

Eine der Datenquelle „Open Access Monitor“ geschuldete und technisch begründete Einschränkung betrifft die Auffindbarkeit eines Artikel über eine DOI und ob der Artikel im „Web of Science“ indexiert ist. Die Fokussierung auf die drei Merkmale Artikel, DOI und Web of Science bedeutet auch, dass nicht die gesamte Publikationstätigkeit an einer Wissenschaftseinrichtung analysiert wird. Durchaus relevante Bereiche wie bspw. Buchpublikationen oder nicht-englischsprachige Zeitschriften bleiben bei dieser Betrachtung außen vor. Diese Limitierung ist hauptsächlich auf die unzureichende qualitative und quantitative Verfügbarkeit von Publikationsmetadaten in den jeweiligen Bereichen zurückzuführen. Anders als neuere bibliographische Datenbanken, wie bspw. OpenAlex, bietet das Web of Science eine umfangreiche Sammlung von Adressdaten von Korrespondenzautorinnen und -autoren, die für eine Zuordnung eines Artikels zu einer Einrichtung unabdingbar ist. Zudem ist die Selektivität des Web of Science dokumentiert und damit nachvollziehbar. Mögliche andere Datenquellen wie Hochschulbibliographien oder institutionelle Repositorien – sofern vorhanden – sind sehr heterogen in Struktur und Abdeckung, weswegen sie nicht zur Erstellung standardisierter Reports geeignet sind. Gerne unterstützt die Landesinitiative openaccess.nrw die Hochschulen der DH.NRW bei der Auswertung ihrer Hochschulbibliographien bzw. institutionellen Repositorien sowie lokal vorhandener Kostendaten.

Footnotes

  1. Eine Prüfung, ob diese wissenschaftsgeleitetet oder oder von Wissenschaftseinrichtungen getragenen sind, kann im Rahmen dieses Montorings nicht erfolgen.↩︎

  2. Einschränkend ist zu berücksichtigen, dass Unpaywall (und damit auch der Open Access Monitor) seit ca. 2019 erscheinende Artikel in Zeitschriften, deren sämtliche Jahrgänge kostenlos zugänglich sind, die aber über keine Informationen zu einer offenen Lizenz verfügen, als „Gold Open Access“ klassifiziert, obwohl diese eigentlich „Bronze Open Access“ sind.↩︎