17. Januar 2025
  WEITERE NEWS
Aktuelles aus
L
ibrary
Essentials

In der Ausgabe 9/2024 (Dezember 2024) lesen Sie u.a.:

  • Wie Suchalgorithmen und KI unsere Wahrnehmung des Klimawandels beeinflussen
  • ChatGPT liefert häufig ungenaue Quellenangaben für Verlagsinhalte
  • Ein Jahrhundert LIS-Forschung:
    Entwicklung und Trends in der Bibliotheks- und Informationswissenschaft –
    eine szientometrische Analyse
  • Metadaten als Schlüssel für Vertrauensbildung in der Wissenschaft
  • Journal Impact Factors: Wie ChatGPT wissenschaftliche Zeitschriften beurteilt
  • KI-gestützte Literaturübersichten:
    Der nächste Schritt in der Forschungsautomatisierung
  • Gemeinsamer Fahrplan für Open Research Information: Ein Blick auf das Treffen
    an der Sorbonne in Paris
  • MINT-Expertise im Bibliothekswesen: Chancen für Open Science
  • Die Vergänglichkeit des Digitalen: Cyberangriffe auf Bibliotheken und Archive bedrohen unser kulturelles Erbe
  • Bibliotheken als Orte des Lernens
    und der Meinungsfreiheit: Eine Balance
    zwischen Ruhe und Diskurs
u.v.m.
  fachbuchjournal

Preprints als Informationsquelle besser nutzbar machen

TH Köln und ZB MED entwickeln im DFG-Projekt
eine Information Extraction Pipeline für Preprints

Im Projekt PIXLS – Preprint Information eXtraction for Life Sciences werden die TH Köln und ZB MED – Informationszentrum Lebenswissenschaften in den kommenden drei Jahren eine Anwendung entwickeln, die Preprint Server automatisiert erschließt. Damit kann die Forschungscommunity die aktuellen Informationen, die auf Preprint Servern veröffentlicht wurden – und daher in klassischen Nachweis- und Suchsystemen kaum auftauchen – besser nutzen. Die Deutsche Forschungsgemeinschaft (DFG) fördert das Projekt im Rahmenprogramm e-Research Technologien.

Preprints stellen eine relativ neue Art dar, wissenschaftliche Ergebnisse noch vor dem Peer Review und der Veröffentlichung in einem Fachjournal für die Forschung bereitzustellen. So können aktuelle Erkenntnisse schnellstmöglich verbreitet und nachgenutzt werden. Mittlerweile gibt es verschiedene Server, die Preprints für unterschiedliche Forschungscommunitys bereitstellen. Sie unterscheiden sich technisch oder inhaltlich. Preprints.org ist beispielsweise multidisziplinär ausgerichtet, während bioRxiv ausschließlich Preprints aus den Lebenswissenschaften enthält.

Die Arbeitsgruppen aus der TH Köln – unter Leitung von Prof. Dr. Philipp Schaer – und von ZB MED – unter Leitung von Prof. Dr. Konrad Förstner – werden in PIXLS ein System entwickeln, das die bisher noch vernachlässigten Informationsquellen auf den Preprint Servern systematisch erschließt und durch Mehrwertdienste besser zugänglich macht. So können sowohl die Volltexte als auch die Metadaten einfacher nachgenutzt werden. Das PIXLSTeam setzt dabei auf eine sogenannte Information Extraction Pipeline, eine Anwendung, die aus den unstrukturierten Daten der Preprints – also Fließtexte oder Zahlen – strukturierte Informationen extrahiert. Solche strukturierten Informationen können von Datenbanken besser verarbeitet werden. Sie können dadurch auf vielfältige Weise nachgenutzt werden und sind darüber hinaus einfacher auffindbar.

Die extrahierten Daten werden im ZB MED Knowledge Environment – eine von ZB MED bereits entwickelte Datenbank – zusammengeführt und vereinheitlicht. Diese Datenbasis macht es dann möglich, Mehrwertdienste zu entwickeln und für die Forschung bereit zu stellen. Das können zum Beispiel Linked-Open-Data-Schnittstellen oder innovative Reputations- und Trendindikatoren sein. Die Daten werden auch über LIVIVO, den Discovery Service von ZB MED, verfügbar sein. Im Sinne von Open Science werden sowohl die Daten als auch die Technologie der Bibliotheks- und Wissenschaftscommunity zur Nachnutzung zur Verfügung gestellt.

www.th-koeln.de
www.zbmed.de