Postgraduales Fernstudium Elektronisches Publizieren und Open Access PDF
Document Details
Uploaded by CongenialBougainvillea1993
FIZ Karlsruhe
Wolfram Horstmann
Tags
Related
- Electronic Instrument Systems (5.1) PDF
- Orthopedic Technician Module 1.1 Healthcare Communication 2024/1445 PDF
- اإلعالم واالتصال االلكتروني PDF
- Communications in Ecotopia: Press, Television, and Publishing
- Lecture 3: Multimedia and Electronic Editing PDF
- Postgraduales Fernstudium Elektronisches Publizieren & Open Access PDF
Summary
This document is a course on "Elektronisches Publizieren und Open Access." It's part of a postgraduate program (Postgraduales Fernstudium) and covers an introduction to the topic and details technical fundamentals, including digital signals and character encoding. The document describes basic concepts and elements of the discipline, presented in lecture notes format.
Full Transcript
Postgraduales Fernstudium Einführung Elektronisches Publizieren und Open Access Prof. Dr. Wolfram Horstmann Institut für Bibliotheks- und Informationswissenschaft / FIZ Karlsruhe E-Mail: [email protected] Postgr...
Postgraduales Fernstudium Einführung Elektronisches Publizieren und Open Access Prof. Dr. Wolfram Horstmann Institut für Bibliotheks- und Informationswissenschaft / FIZ Karlsruhe E-Mail: [email protected] Postgraduales Fernstudium Elektronisches Publizieren und Open Access Gliederung 1. Kurs Einführung 2. Kurs Elektronisches Publizieren 3. Kurs Open Access Aufbaukurs Wunschthemen, Diskussion und Aufgabenvorstellungen Vertiefung im nächsten Wintersemester: „ Digital Humanities und Digital Science“ ÜBERSICHT 2.1. TECHNISCHE GRUNDLAGEN 2.2. ANFORDERUNGEN AN DATEIFORMATE 2.3. BESCHREIBUNG VON DATEIFORMATEN 2.4. MARK-UP-LANGUAGES 2.5. BEWERTUNG VON DATEIFORMATEN 2.6. DIGITALE REPOSITORIEN 2.7. PUBLIKATIONSSYSTEME 2.8. WEITERE INNOVATIONEN Elektronisches Publizieren 2.1. TECHNISCHE GRUNDLAGEN Elektronisches Publizieren You are here https://101innovations.wordpress.com 4 Elektronisches Publizieren 2.1. Technische Grundlagen Definition von analogen und digitalen Signalen Ein analoges Signal ist ein physischer Wert, der kontinuierlich gemäß Zeit und / oder Raum schwankt. Ein digitales Signal ist eine zeit- oder raumunabhängige Folge von Werten, die im Binärformat Ein analoges Signal ist ein physischer Wert, der kontinuierlich gemäß Zeit und / kodiert sind, was sich aus der Umwandlung vom analogen Signal ergibt. oder Raum schwankt. Ein digitales Signal ist eine zeit- oder raumunabhängige Folge von Werten, die im Binärformat kodiert sind, was sich aus der Umwandlung vom analogen Signal ergibt. https://de.wikipedia.org/wiki/Digitalsignal 5 https://www.technologyuk.net/telecommunications/telecom-principles/digital-signals.shtml Elektronisches Publizieren 2.1. Technische Grundlagen Zeichencodierung UnterUnicode 1963 1964 1991 UTF-87Zeichenkodierung 8Unicode Bit-Version Bit-Zeichencode des Transformation Unicode des ASCII-Codes von versteht Consortium IBMFormat (EBCDI) man das (ISO-Norm) Langfristig Darstellen solleines für jedes Zeichens sinntragende mittels eines Zeichen im Aufbau aller bekannten einfacheren Schriftkulturen oder für die betreffende und Zeichensysteme Anwendung eingeeigneteren digitaler CodeCodes. festgelegt werden. Unter Zeichenkodierung versteht man das Darstellen eines Zeichens mittels eines im Aufbau einfacheren oder für die betreffende Anwendung geeigneteren Codes. 1963 7 Bit-Version des ASCII-Codes 1964 8 Bit-Zeichencode von IBM (EBCDI) 1991 Unicode des Unicode Consortium (ISO-Norm) UTF-8 Unicode Transformation Format Langfristig soll für jedes sinntragende Zeichen aller bekannten Schriftkulturen und Zeichensysteme ein digitaler Code festgelegt werden. 6 Elektronisches Publizieren 2.1. Technische Grundlagen Was ist ein Dokument? Früher – papierbasierte Repräsentation von Text, Bildern und Grafiken (sequentiell) Heute – Erweiterung um Begriffe wie ✓ Hypertext – kleinere semantisch abgeschlossene Texteinheiten, die über Hyperlinks (nicht zwingend sequentiell) zusammengefügt werden ✓ Multimedia-Dokumente (Animation, Sprache, Bewegtbilder,…) ✓ Dynamische Dokumente – Dokumente, die zum Zeitpunkt des Aufrufens erst gebildet werden und sich in Abhängigkeit der jeweiligen Bedingungen nicht in gleicher Weise repräsentieren. 7 Elektronisches Publizieren 2.1. Technische Grundlagen Was ist ein Dokument? Inhalt (wissenschaftliche) Erkenntnis oder Visualisierung des strukturierten Aussage, Inhalts; Layout (Aussehen, Größe, formuliert in Text, Farbe, Abstände, Ausrichtung, Bild, Ton usw. gestalterische Anordnung, …) Darstellung logische Anordnung (Abfolge, Aufteilung, Hierarchie, Verweise) Struktur Elektronisches Publizieren 2.1. Technische Grundlagen Was ist ein elektronisches Dokument? Inhalt – Text, Bild, Bewegtbild, Audiosequenz, … Struktur – z.B. Titelblatt, Hauptüberschrift, Kapitel, Unterkapitel, Zitat, Fußnote, Formatinformation – sämtliche Informationen, die dazu notwendig sind, das Dokument in seiner Gestalt sichtbar zu machen (Bildschirm, Papier, …) Metadaten – inhaltliche, strukturelle und technische Beschreibung des Dokumentes 9 Elektronisches Publizieren 2.1. Technische Grundlagen Programme zum Erstellen von Texten Editoren Textverarbeitungssysteme Textsatzsysteme Desktop Publishingsysteme Webbasierte Werkzeuge 10 Elektronisches Publizieren 2.1. Technische Grundlagen Bearbeiten Texteditor Editoren Zum Erstellen Ändernist von von ein von Quelltexten Computerprogramm Konfigurationsdateien Notizen zum Bearbeiten von Texten mit nur sehr eingeschränkten Möglichkeiten hinsichtlich der Layoutgestaltung und speichert den Text meist als reinen ASCII-Zeichenfolge ohne Editoren Formatierungen Texteditor ist ein Computerprogramm zum Bearbeiten von Texten mit nur sehr eingeschränkten Möglichkeiten hinsichtlich der Layoutgestaltung und speichert den Text meist als reinen ASCII-Zeichenfolge ohne Formatierungen Zum Erstellen von Notizen Zum Ändern von Konfigurationsdateien Bearbeiten von Quelltexten 11 Elektronisches Publizieren 2.1. Technische Grundlagen Textverarbeitungssystem Textverarbeitungssysteme Zusätzliche WYSIWYG –Funktionalitäten FunktionalitätistWhat wie ein Computerprogramm Rechtschreibprüfung, you see is what youzum get Indexerstellung, Bearbeiten vonSuch- Texten undmit Ersetzfunktionen, mehr oder weniger Textbausteine, komfortablenu. Möglichkeiten ä. der Layoutgestaltung und des Einbindens von Grafiken, Tabellen u. ä. Textverarbeitungssysteme Textverarbeitungssystem ist ein Computerprogramm zum Bearbeiten von Texten mit mehr oder weniger komfortablen Möglichkeiten der Layoutgestaltung und des Einbindens von Grafiken, Tabellen u. ä. Zusätzliche Funktionalitäten wie Rechtschreibprüfung, Indexerstellung, Such- und Ersetzfunktionen, Textbausteine, u. ä. WYSIWYG – Funktionalität What you see is what you get 12 13 14 Elektronisches Publizieren 2.1. Technische Grundlagen Textsatzsystem Zusätzliche Eigener Besonders Keine TeX, Beispiele: BibTeX LaTeX WYSIWYG-Funktionalität für Schriftgenerator Literaturangaben günstige Funktionalitäten ist eine Darstellung Spezialform wiemathematischer Macrosammlung, eines Textverarbeitungssystems, Formeln Möglichkeit der Programmierung das vorrangig fürvon dieeigenen Vorbereitung Macros, desexzellente Drucks ausgelegt typografische ist. Komponenten, Textsatzsystem Textsatzsystem ist eine Spezialform eines Textverarbeitungssystems, das vorrangig für die Vorbereitung des Drucks ausgelegt ist. Zusätzliche Funktionalitäten wie Macrosammlung, Möglichkeit der Programmierung von eigenen Macros, exzellente typografische Komponenten, Eigener Schriftgenerator Besonders günstige Darstellung mathematischer Formeln Keine WYSIWYG-Funktionalität Beispiele: ▪ TeX, LaTeX ▪ BibTeX für Literaturangaben 15 Elektronisches Publizieren 2.1. Technische Grundlagen Desktop Im „Publizieren Ablösung Viele QuarkXPress InDesign Beispiele: Unterschied Funktionen Publishingsystem vergangener vomzuheute Schreibtisch Textsatzsystemen Druckherstellungsverfahren Standard aus“in Textverarbeitungsprogrammen, werden bei DTP-Systemen digitale Verfahren Druckvorstufen aber ersetzen Verwendung die auffotografischen dernoch Basispräsent von grafischen Druckvorstufen („Bleisatz-Orientierung“) Nutzeroberflächen realisiert. Desktop Publishingsystem Im Unterschied zu Textsatzsystemen werden bei DTP- Systemen Druckvorstufen auf der Basis von grafischen Nutzeroberflächen realisiert. „Publizieren vom Schreibtisch aus“ Ablösung vergangener Druckherstellungsverfahren digitale Verfahren ersetzen die fotografischen Druckvorstufen Viele Funktionen heute Standard in Textverarbeitungsprogrammen, aber Verwendung noch präsent („Bleisatz-Orientierung“) Beispiele: ▪ InDesign ▪ QuarkXPress 16 17 18 Elektronisches Publizieren 2.1. Technische Grundlagen Webbasierte Vielfältige Arbeiten Online-Speicherung Versionskontrolle Überarbeitungen Zusammenarbeit Andere Google-Docs, Beispiele Tabellenkalkulation/Präsentation/Kommunikation Programme imEntwicklungen Browser Werkzeuge (Office365,) für Bürorabeit/Office/Productivity Authorea, ShareLaTeX, Overleaf Webbasierte Werkzeuge Vielfältige Entwicklungen Zusammenarbeit Überarbeitungen Versionskontrolle Online-Speicherung Arbeiten im Browser Andere Programme für Bürorabeit/Office/Productivity Tabellenkalkulation/Präsentation/Kommunikation Beispiele ▪ Google-Docs, (Office365,) Authorea, ShareLaTeX, Overleaf 19 Elektronisches Publizieren 2.1. Technische Grundlagen Was sind Dateiformate? Das Dateiformat legt den Inhalt von Dateien fest. Es handelt sich dabei um vereinbarte Konventionen der inneren Struktur, wie Informationen eines bestimmten Datentyps, beispielsweise Text, Grafik, Video, Audio, Tabellen angeordnet sind. Nur wenn diese Konventionen für die unterschiedlichen Dateiformate eingehalten werden, können die Computer- und Anwendungsprogramme diese Dateiformate lesen. Ein Dateiformat ist bestimmten Anwendungsprogrammen zugeordnet und wird durch die Dateinamenerweiterung, die File Extension gekennzeichnet. Die File Extension wird als zwei-, drei- oder vierbuchstabige Endung an den Dateinamen angehängt; getrennt durch einen Punkt.Dateiformate können durch Softwarehersteller (proprietär) oder Standardisierungsgremien festgelegt werden. Quelle: http://www.itwissen.info/definition/lexikon/Dateiformat-file-format.html (Vorsicht Werbung) 20 ÜBERSICHT 2.1. TECHNISCHE GRUNDLAGEN 2.2. ANFORDERUNGEN AN DATEIFORMATE 2.3. BESCHREIBUNG VON DATEIFORMATEN 2.4. MARK-UP-LANGUAGES 2.5. BEWERTUNG VON DATEIFORMATEN 2.6. DIGITALE REPOSITORIEN 2.7. PUBLIKATIONSSYSTEME 2.8. WEITERE INNOVATIONEN Elektronisches Publizieren 2.2. ANFORDERUNGEN AN DATEIFORMATE Elektronisches Publizieren 2.2. Anforderungen an Dateiformate Was sind Dateiformate? ✓Ergebnis der Abspeicherung von Computeranwendungssystemen ✓Bei Textverarbeitungssystemen liegen die Unterschiede hauptsächlich in der Wiedergabe der Formatspezifikationen ✓Die Kompatibilität von Dateiformat ist Voraussetzung für die Lesbarkeit der Ausgabe anderer Systeme ✓Bedeutungsvoll für: Langfristverfügbarkeit, Retrieval, u. ä. 22 Elektronisches Publizieren 2.2. Anforderungen an Dateiformate Verfügbarkeit und Beherrschbarkeit ✓Erstellung und Bearbeitung von Dokumenten ✓Verfügbarkeit auf den gängigen Rechnerplattformen ✓Erlernbarkeit ✓Preis für die Software 23 Elektronisches Publizieren 2.2. Anforderungen an Dateiformate Verfügbarkeit und Beherrschbarkeit Konvertierbarkeit und Austauschbarkeit ✓Informationsverlustfreie Konvertierung in andere Formate ✓Konvertierungsaufwand ✓Verhältnis von Dateigröße zum Dateiumfang ✓Problemloser Austausch über Rechnernetze 24 Elektronisches Publizieren 2.2. Anforderungen an Dateiformate Verfügbarkeit und Beherrschbarkeit Konvertierbarkeit und Austauschbarkeit Präsentierbarkeit ✓Bildschirmdarstellung identisch mit Druckexemplar ✓Darstellung von Dokumententeilen ✓Zitierbarkeit ✓Nutzbarkeit von Hyperlinks ✓Darstellung von Sonderzeichen, Multimediaelementen,... 25 Elektronisches Publizieren 2.2. Anforderungen an Dateiformate Verfügbarkeit und Beherrschbarkeit Konvertierbarkeit und Austauschbarkeit Präsentierbarkeit Recherchierbarkeit ✓Volltextsuche ✓Suche in Metadaten ✓Strukturelle Suche in speziell ausgezeichneten Bestandteilen ✓Suche in Formeln ✓Suche in Grafiken, Videos, Audiosequenzen 26 Elektronisches Publizieren 2.2. Anforderungen an Dateiformate Verfügbarkeit und Beherrschbarkeit Konvertierbarkeit und Austauschbarkeit Präsentierbarkeit Recherchierbarkeit Strukturierbarkeit ✓Kennzeichnung der logischen Bestandteile ✓Nur in strukturierten Teilen lässt sich treffsicher recherchieren ✓Gesonderte Layoutinformationen 27 Elektronisches Publizieren 2.2. Anforderungen an Dateiformate Verfügbarkeit und Beherrschbarkeit Konvertierbarkeit und Austauschbarkeit Präsentierbarkeit Recherchierbarkeit Strukturierbarkeit Archivierung und Standardisierung ✓Langzeitarchivierung ohne proprietäre Formate ✓Lesbarkeit ✓Wiederauffindbarkeit 28 ÜBERSICHT 2.1. TECHNISCHE GRUNDLAGEN 2.2. ANFORDERUNGEN AN DATEIFORMATE 2.3. BESCHREIBUNG VON DATEIFORMATEN 2.4. MARK-UP-LANGUAGES 2.5. BEWERTUNG VON DATEIFORMATEN 2.6. DIGITALE REPOSITORIEN 2.7. PUBLIKATIONSSYSTEME 2.8. WEITERE INNOVATIONEN Elektronisches Publizieren 2.3. BESCHREIBUNG VON DATEIFORMATEN Elektronisches Publizieren 2.3. Beschreibung von Dateiformaten -- Historisches Microsoft Word (Microsoft I) Textverarbeitungssoftware von Microsoft mit einem proprietären Dateiformat Verfügbar für die Betriebssysteme Windows und Mac OS Namenserweiterung mit.doc für Dokumente und.dot bzw. für Vorlagen Sehr hoher Verbreitungsgrad und für viele deshalb ein Quasistandard Vor dem Hintergrund der Wahrung der Marktbeherrschung wird das Format nicht vollständig offen gelegt 30 Elektronisches Publizieren 2.3. Beschreibung von Dateiformaten -- Historisches Office Open XML (Microsoft II) Spezifikation des neuen Office-Dateiformates auf Basis von XML Offenes Format auf der Basis von XML Normierung durch die ECMA (European Association for Standardizing Information and Communication Systems ) durch Microsoft eingereicht docx (Word), dotx (Word-Vorlagen), xlsx (Excel), pptx (Powerpoint), potx (Powerpoint-Vorlage) ZIP-Datei als „Transportschale“ (analog zu ODF) komplexer Standard (ca. 6000 Seiten Spezifikation) Struktur ist nicht so stark sequentiell (tiefere Schachtelung) seit Dezember 2006 ECMA-Standard seit März 2008: ISO-Standard 31 Elektronisches Publizieren 2.3. Beschreibung von Dateiformaten -- Historisches ODF – OpenDocument Format for Office Applications Ziel: standardisiertes Dateiformat für Textverarbeitung (und Office) Arbeitsgruppe bei der OASIS (Organization for the Advancement of Structured Information Standards) Zukunft des Formats soll nicht von einzelnen Anbietern abhängen (z.B. für gesetzeskonforme Langzeitablage) Veröffentlichung: Mai 2005 Akivitäten öffentlicher Institutionen (EU, Massachusetts, Wien, München) ODF Alliance: seit März 2006 (IBM, Oracle, Novell, Opera, …) 3. Mai 2006: ISO-Standard (ISO 26300) siehe http://www.odfalliance.org/press/AllianceRelease3May06.pdf 32 Elektronisches Publizieren 2.3. Beschreibung von Dateiformaten -- Historisches ODF (2) Offenes Format auf der Basis von XML ODF-Datei: ZIP-Archiv mit XML-Dateien und anderen Objekten odt (Texte), ods (Tabellendokumente), odp (Präsentationen), odg (Zeichnungen), odc (Diagramme), odi (Bild), odf(Formel), odb (Datenbankobjekte) Unterstützung durch OpenOffice 3.0, StarOffice 8 KOffice 1.5 AbiWord, Textmaker (einlesen) Corel Word Perfect (in Aussicht) Microsoft lehnt ODF ab – keine Unterstützung eigene Entwicklung: Office Open XML 33 Elektronisches Publizieren 2.3. Beschreibung von Dateiformaten -- Historisches PDF – Portable Document Format Plattformunabhängiges, proprietäres aber offengelegtes Dateiformat der Firma Adobe (1993 erstmals veröffentlicht) Aktuelle Version: 1.7 (Standardisierung bei ISO seit 01.07.08) Die Teilmengen PDF/X und PDF/A sind ISO-Normen. Die Benutzenden sollten den Inhalt nicht (ohne Weiteres) ändern können. Nutzung anfänglich nur mit Adobe-Software (Reader, …) Dokumentenbeschreibungssprache, die Dokumente des Ursprungsprogramms (Schriften, Farben, Grafiken) exakt wiedergibt und in nummerierten Objekten abspeichert Prinzipielle Möglichkeit des Dokumentenschutzes 34 Elektronisches Publizieren 2.3. Beschreibung von Dateiformaten -- Historisches PDF (2) – PDF/X genormte Version, die als Druckvorstufe gilt ✓ für Austausch von Anzeigen in Zeitungen entwickelt ✓ seit 2001 ISO-Standard ✓ Informationen über Seitengröße ✓ Zusätzliche Informationen zur Druckersteuerung sind zwingend (exakte Farbangaben, eingebettete Schriften, Angaben zur Überfüllung) ✓ Ausschluss von Sonderfunktionen, die das Druckergebnis unvorhergesehen beeinflussen können ✓ Validierungsprogramme für automatische Prüfung vorhanden (z. B. Preflight in Adobe Acrobat) 35 Elektronisches Publizieren 2.3. Beschreibung von Dateiformaten -- Historisches PDF (3) – PDF/A Standard für die Langzeitarchivierung ✓ stellt Mechanismus bereit, "um elektronische Dokumente auf eine Weise darzustellen, so dass das visuelle Erscheinungsbild über die Zeit erhalten bleibt, unabhängig von den Werkzeugen und Systemen zur Herstellung, Speicherung und Reproduktion." (Auszug aus ISO 19005-1) ✓ wesentliches Ziel: zukünftige Reproduzierbarkeit ✓ seit 2005 ISO-Standard ✓ bezogen auf Version 1.4, Standard beschreibt nur Unterschiede zur Referenz ✓ Alternative zu TIFF ✓ Alle notwendigen Informationen müssen im Dokument enthalten sein (Schriftarten usw.) ✓ Ausschluss diverser Funktionalitäten sowie Verweise auf externe Quellen 36 ÜBERSICHT 2.1. TECHNISCHE GRUNDLAGEN 2.2. ANFORDERUNGEN AN DATEIFORMATE 2.3. BESCHREIBUNG VON DATEIFORMATEN 2.4. MARK-UP-LANGUAGES 2.5. BEWERTUNG VON DATEIFORMATEN 2.6. DIGITALE REPOSITORIEN 2.7. PUBLIKATIONSSYSTEME 2.8. WEITERE INNOVATIONEN Elektronisches Publizieren 2.4. MARK-UP-LANGUAGES Elektronisches Publizieren 2.4. Markup Language (Markup-Sprachen) „Markup Language“ Zweck: Beschreibung von Daten und Dokumentbestandteilen Markierung von bestimmten Teilen, Abschnitten (Wörter, Sequenzen, Sätze, Zeichen) = Elemente mit Tags Quelltexte als ASCII-Code oder Unicode gespeichert menschenlesbar und maschinenlesbar Auszeichnungssprachen sind in der Regel deskriptiv einige Beispiele sind prozedural 38 Elektronisches Publizieren 2.4. Markup Language (Markup-Sprachen) SGML (Metasprache) XML (Metasprache) (x)HTML DocBook SVG TEI MathML MusicML CML X3D DiML... 39 Elektronisches Publizieren 2.4. Markup Language (Überblick) Document Style Semantics and Specifications Language Cascading Style Sheets Extensible Stylesheet Language Transformation Quelle: Behme, Mintert: XML in der Praxis 40 Elektronisches Publizieren 2.4. Markup Language (Grundlagen) Markup Alle Zeichen im Dokument, die nicht zum Dokumentinhalt gehören, sondern den Inhalt des Dokumentes näher beschreiben, gliedern, formatieren Tag Oft übliche Bezeichnung für einzelnes Markup- Element, z.B. DTD Document Type Definition, beschreibt in formaler Notation die logische Struktur eines bestimmten Dokumenttyps (SGML / XML) Schema weitere Möglichkeit, Dokumentklassen formal zu beschreiben (XML) 41 Elektronisches Publizieren 2.4. Markup Language (Grundlagen) Dokument-Instanz Individuelles Dokument, das in seiner logischen Struktur einer bestimmten DTD / einem Schema entspricht Entity Abkürzende Schreibweise für einen Dokumentteil Eine Entity kann einzelne Buchstaben oder auch ganze Dateien oder Datensätze bezeichnen 42 Elektronisches Publizieren 2.4. Markup Language (Grundlagen) Element Untereinheit der Dokumentgliederung, kann weitere Elemente enthalten und kann gemäß der DTD/Schema nur in bestimmter Abfolge andere Elementen erlauben bzw. enthalten Attribut Enthält nähere Angaben zu einem Element Ein Attribut kann auch auf verschiedene Elemente angewandet werden. Parser Software, die prüft, ob eine Dokumentinstanz, den Regeln entspricht, die in der angewendeten DTD festgelegt wurden ("Validierung") Erzeugt aus der Dokumentinstanz einen Datenstrom, der dann von einer Applikation verwendet werden kann 43 Elektronisches Publizieren 2.4. Markup Language (Grundlagen) Markup-Sprachen (2) Kennzeichnen von Strukturelementen durch Tags (meist paarweise: Beginn – öffnend; Ende – schließend) z.B. Berlin an der Spree zusätzliche Informationen als Attribute z.B. Berlin an der Spree hierarchische (geschachtelte) Struktur z. B. Berlin an der Spree wohlgeformt z.B. Berlin → nicht wohlgeformt 44 Elektronisches Publizieren 2.4. Markup Language (Grundlagen) Systemische Mykosen bei Patienten nach Knochenmarktransplantation und unter Intensivtherapie Zur Erlangung des akademischen Grades doctor mediciniae (Dr. med.) vorgelegt der Medizinischen Fakultät Charité der Humboldt-Universität zu Berlin Kerstin Hahlweg geb. Hofmann Prof. Dr. Joachim Dudenhausen Fr. Prof. Dr. med. I. Tausch Prof. Dr. med. H.- J. Tietz Priv. Doz. Dr. med. habil. W. Schultze 45 Elektronisches Publizieren 2.4. Markup Language (Grundlagen) 46 Elektronisches Publizieren 2.4. Markup Language (SGML) SGML – Standard Generalized Markup Language Metasprache, Sprachfamilie Seit 1986 ISO-Standard 8879 Entstanden aus Generalized Markup Language (GML) von Goldfarb, Mosher und Lorie (IBM) plattform- und anwendungsunabhängige Beschreibung der logischen Dokumentstruktur (Absätze, Überschriften, Kapitel, …) → unabhängig vom Ausgabemedium generic coding (William W. Tunnicliffe) Erstmalig Trennung von Inhalt, Struktur und Formatangaben in maschinenlesbarer Form Stilkomponente: DSSSL (Document Style Semantics and Specification Language) 47 Elektronisches Publizieren 2.4. Markup Language (SGML) SGML (2) Höchst komplexe Sammlung von Regeln Mit SGML lassen sich beliebige Strukturen beschreiben ✓ Brief (Adresse, Absender, Anrede, Haupttext, Gruß) ✓ Wissenschaftlicher Text (Autoren, Titel, Überschriften, Kapitel, Unterkapitel, Zitate, Literaturhinweise, …) ✓ Bestellung einer Warenlieferung (Anschrift, Kundennummer, Artikel, Qualität, Anzahl, …) ✓ Webseite (Überschriften, Absätze, Tabellen, Bilder, Links, Formulare, Frames, …) Definition einer Struktur mit Document Type Definition (DTD) (innerhalb des Dokuments oder als eigene Datei) →Ergebnis: spezielle Auszeichnungssprache Jedes SGML-Dokument benötigt eine DTD! 48 Elektronisches Publizieren 2.4. Markup Language (SGML) SGML (3) SGML-Deklaration → Definition von allgemeinen Regeln (im SGML-System enthalten) Zeichenkodierung Trennzeichen für Elementnamen Beachtung von Groß- und Kleinschreibung Stringenz beim Tagging (Weglassen von Tags) Beispiele HTML MathML, CML, MusicML DocBook TEI 49 Elektronisches Publizieren 2.4. Markup Language (HTML) HTML – Hypertext Markup Language Auszeichnungssprache für Webseiten (Hypertext) 1989 durch Tim Berners -Lee vom CERN (Centre of European Nuclear Research), Genf, definiert 50 Elektronisches Publizieren 2.4. Markup Language (HTML) HTML – Hypertext Markup Language Auszeichnungssprache für Webseiten (Hypertext) 1989 durch Tim Berners-Lee vom CERN (Centre of European Nuclear Research), Genf, definiert definierte Dokumentstruktur wird von Webbrowsern (u. a.) interpretiert und in eine Darstellungsform (Präsentation) umgewandelt 51 Elektronisches Publizieren 2.4. Markup Language (SGML) HTML (2) basiert auf einer konkreten SGML-DTD erste "populäre" Auszeichnungssprache Stilkomponente: CSS (Cascading Style Sheets) immer noch Grundlage des WWW (auch JS und CSS) aktuelle Browser werden immer mächtiger (HTML5) Kombination mit automatisierten Datenquellen – Application Programming Interface (API) – Java Script Object Notation (JSON) 52 ÜBERSICHT 2.1. TECHNISCHE GRUNDLAGEN 2.2. ANFORDERUNGEN AN DATEIFORMATE 2.3. BESCHREIBUNG VON DATEIFORMATEN 2.4. MARK-UP-LANGUAGES 2.5. BEWERTUNG VON DATEIFORMATEN 2.6. DIGITALE REPOSITORIEN 2.7. PUBLIKATIONSSYSTEME 2.8. WEITERE INNOVATIONEN Elektronisches Publizieren 2.5. BEWERTUNG VON DATEIFORMATEN Bewertung von Dateiformaten (1) Ausgabeformate von Textsystemen ASCII MS Open LaTeX -Text Word Office x erfüllt Verfügbarkeit x o x x o bedingt Strukturierbarkeit - o o o erfüllt Recherchierbarkeit o o o o - kaum Konvertierbarkeit x o x o erfüllt Präsentation o o o x Hypertextfähigkeit - o o o Archivierbarkeit x - o o Standard x - o o Gesamtbewertung o o➔ o➔ o➔ 54 Bewertung von Dateiformaten (2) Durch Konvertierung erzeugte Formate Office PDF SGML XML HTML Open XML Verfügbarkeit x o o o x Strukturierbarkeit x o x x o Recherchierbarkeit o o x x o Konvertierbarkeit o o x x x Präsentation x x o x x Hypertextfähigkeit o x x x x Archivierbarkeit o o x x o Standard o o x x x Gesamtbewertung o➔ o x x o 55 Elektronisches Publizieren 2.5. Bewertung von Dateiformaten XML – Der Königsweg (Vorteile von XML) menschen- und maschinenlesbare Strukturbeschreibung Trennung von Inhalt, Struktur und Layout Standard (unabhängig von einzelnen Herstellern) starke Verbreitung weitreichende Möglichkeiten der Weiterverarbeitung → Datenaustausch → Umwandlung (Konvertierung) → Darstellung (Präsentation) in unterschiedlichsten Formen → qualifizierte Retrievalinstrumente (strukturierte Suche) geeignet für die Langzeitarchivierung 56 Elektronisches Publizieren 2.5. Bewertung von Dateiformaten XML – Der Königsweg (Vorteile von XML) https://journals.tdl.org/jodi/index.php/jodi/article/view/76/75 57 Elektronisches Publizieren 2.5. Bewertung von Dateiformaten PDF – Die pragmatische Alternative einfache Handhabbarkeit (aus Nutzersicht) Abgeschlossenheit (Bilder, Layoutinformationen, Schriftarten) "gesichertes" Layout → z.B. für print-on-demand → zusätzliche Version neben XML/HTML Probleme: → proprietär und nicht standardisiert (bislang) → laufende Weiterentwicklung Ansatz für Langzeitarchivierung: PDF/A → Eingrenzung und feste Regeln → Standard 58 Elektronisches Publizieren 2.5. Bewertung von Dateiformaten Ausblick – Statische Dateiformate unterstützen Zitation und Reproduzierbarkeit – Behandelt wurden hier nur Dokumente, die zentral für die Wissenschaftskommunikation sind – Elektronisches Publizieren kann jedoch sehr viele andere Formen annehmen, die hier nicht behandelt werden, z.B. Buchmarkt Multimedia-Markt – Außerdem werden auch traditionelle Text-Bild-Inhalte zunehmend durch dynamische Publikationsformen ergänzt (s.u.) 59 ÜBERSICHT 2.1. TECHNISCHE GRUNDLAGEN 2.2. ANFORDERUNGEN AN DATEIFORMATE 2.3. BESCHREIBUNG VON DATEIFORMATEN 2.4. MARK-UP-LANGUAGES 2.5. BEWERTUNG VON DATEIFORMATEN 2.6. DIGITALE REPOSITORIEN 2.7. PUBLIKATIONSSYSTEME 2.8. WEITERE INNOVATIONEN Elektronisches Publizieren 2.6. DIGITALE REPOSITORIEN Elektronisches Publizieren You are here 61 Elektronisches Publizieren 2.6. Digitale Repositorien Hintergründe – Nachdem ein Dokument erstellt ist kann es im Web zur Verfügung gestellt werden – Digitale Repositorien (DR) erlauben es Autoren dies selbstgesteuert zu tun, um eine direkte Verbindung zwischen Autor & Leser herzustellen – DR erfüllen Funktionen der Sichtbarmachung, Verbreitung, und Archivierung – DR erfüllen i.d.R. nicht das Kriterium der Qualitätskontrolle – es können aber Dokumente abgelegt werden, die qualitätsgesichert sind – Alternativen: Web Content Management System (s. „Werkzeuge“ und Publikationssystem (s.u.) – Varianten: Institutionelle Repositorien (s. Open Access), fachliche Repositorien & Publikationsdatenmanagementsysteme 62 Research cycle & repositories Pre-research documents Grey literature? Learning materials Raw data Simulations Books , Processed reviews, etc. Repository data Infrastructure Secondary Research publications documents Published reports Theses Patent documents Pre-prints Aus: e-SciDR-Lisbon Workshop Discussion Paper Elektronisches Publizieren 2.8. Digitale Repositorien Beispiel für ein Institutional Repository https://ora.ox.ac.uk 64 Elektronisches Publizieren 2.8. Digitale Repositorien Beispiel für ein fachliches Repository https://arxiv.org/ 65 Elektronisches Publizieren 2.8. Digitale Repositorien Beispiel für ein Publikationsdatenmanagementsystem 66 https://pub.uni-bielefeld.de Elektronisches Publizieren 2.6. Digitale Repositorien Identifizierungsmöglichkeiten ISBN Die International Standard Book Number (Internationale Standardbuchnummer), abgekürzt ISBN, ist eine eindeutige 10- bzw. 13-stellige Nummer zur Kennzeichnung von Büchern und anderen selbstständigen, nicht fortlaufenden Veröffentlichungen, wie beispielsweise Multimedia-Produkten und Software. ISSN Die International Standard Serial Number (englisch, Internationale Standardseriennummer) (ISSN) ist eine Nummer, die Zeitschriften und Schriftenreihen eindeutig identifiziert, ähnlich wie es für Bücher die ISBN gibt. Die ISSN basiert auf der internationalen Norm ISO 3297. URLUnified Resource Locator identifizieren eine Ressource über ihren primären Zugriffsmechanismus (häufig http oder ftp) und den Ort (engl. location) der Ressource in Computernetzwerken. Der Name des URI-Schemas ist daher in der Regel vom hierfür verwendeten Netzwerkprotokoll abgeleitet. Beispiele hierfür sind HTTP oder FTP. URN ist ein Uniform Resource Identifier (URI) mit dem Schema urn, der als dauerhafter, ortsunabhängiger Bezeichner für eine Ressource dient DOIerlaubt eine eindeutige und permanente Identifikation digitaler Objekte. Mit digitalen Objekten ist hier gemeint: intellektuelle Güter in digitaler Form. 67 ISBN URL ISSN DOI URN 68 Elektronisches Publizieren 2.8. Digitale Repositorien http://www.opendoar.org/onechart.php 69 http://v2.sherpa.ac.uk/view/repository_visualisations/1.html Elektronisches Publizieren 2.8. Digitale Repositorien Discovery / Auffindbarkeit: Google Scholar http://www.opendoar.org/onechart.php 70 https://www.base-search.net/about/de/about_statistics.php Elektronisches Publizieren 2.8. Digitale Repositorien: BASE Discovery / Auffindbarkeit 71 Elektronisches Publizieren 2.6. Digitale Repositorien Anforderungen am Beispiel DINI-Zertifikat („Kriterien“) 1. 1 – Sichtbarkeit des Gesamtangebots 2. 2 – Leitlinien (Policy) 3. 3 – Unterstützung für Autor*innen und Herausgeber*innen 4. 4 – Rechtliche Aspekte 5. 5 – Informationssicherheit 6. 6 – Erschließung und Schnittstellen 7. 7 – Offene Metriken (Nutzungsstatistiken) 8. 8 – Langzeitarchivierung http://www.dini.de/dini-zertifikat/ 72 Elektronisches Publizieren 2.6. Digitale Repositorien Weitere Spezifikationen Core Trust Seal Nestor Technische Standards (ISO und DIN) Protokolle OAI-PMH Web-Services Metadaten Dublin Core Element Set, METS, MODS... Linked Open Data, Semantic Web, RDF-XML 73 ÜBERSICHT 2.1. TECHNISCHE GRUNDLAGEN 2.2. ANFORDERUNGEN AN DATEIFORMATE 2.3. BESCHREIBUNG VON DATEIFORMATEN 2.4. MARK-UP-LANGUAGES 2.5. BEWERTUNG VON DATEIFORMATEN 2.6. DIGITALE REPOSITORIEN 2.7. PUBLIKATIONSSYSTEME 2.8. WEITERE INNOVATIONEN Elektronisches Publizieren 2.7. PUBLIKATIONSSYSTEME Elektronisches Publizieren 2.7. Publikationssysteme Hintergrund – Publikationssysteme beinhalten neben Sichtbarmachung, Verbreitung, und Archivierung (s. Digitale Repositorien) auch den Aspekt „Qualitätskontrolle“ – In kommerziellen Kontexten außerdem den Aspekt „Marketing“ – „Qualitätskontrolle“ im wissenschaftlichen Publikationswesen bezieht sich vor allem Begutachtungssysteme (Peer Review) – Technisch kommt hinzu: Versionierung & Workflow-Unterstützung – Kommerzielles Beispiel: Manuscript Central / ScholarOne – Open Source Beispiel: Open Journal Systems 75 Elektronisches Publizieren 2.7. Publikationssysteme Begutachtungssysteme und Publikationsworfklows sind komplex Typische Verfahren - Blind Review - Double Blind Review - Open Review - Publikation beinhaltet ferner - Copyediting - Layout - Proofreading 76 ÜBERSICHT 2.1. TECHNISCHE GRUNDLAGEN 2.2. ANFORDERUNGEN AN DATEIFORMATE 2.3. BESCHREIBUNG VON DATEIFORMATEN 2.4. MARK-UP-LANGUAGES 2.5. BEWERTUNG VON DATEIFORMATEN 2.6. DIGITALE REPOSITORIEN 2.7. PUBLIKATIONSSYSTEME 2.8. WEITERE INNOVATIONEN Elektronisches Publizieren 2.8. WEITERE INNOVATIONEN Elektronisches Publizieren 2.8. Weitere Innovationen Ausblick – Statische Dateiformate unterstützen Zitation und Reproduzierbarkeit – Statische Dateiformate sind nach wie vor eine wesentliche Einheit des wissenschaftlichen Publizierens – Wissenschaftskommunikation erfordert heute dynamische Formate Veranschaulichung von Dynamik und Komplexität Interaktion Forschungsdatenpublikation Simulation – Dynamische Dateiformate erhalten eine immer bedeutendere Rolle – Elektronisches Publizieren wird atomarer und reichhaltiger 78 Elektronisches Publizieren 2.8. Weitere Innovationen Vertiefung: Werkzeuge der digitalen Wissenschaftskommunikation 79