Last active
June 15, 2017 14:26
-
-
Save cneud/2e4f8a5352133ba5296c647409791636 to your computer and use it in GitHub Desktop.
DFG Zeitungsdigitalisierung Wegweiser Workflow interaktiv
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
<!DOCTYPE html> | |
<html lang="de"> | |
<head> | |
<meta charset="UTF-8"> | |
<meta name=viewport content="width=device-width, initial-scale=1"> | |
<title>Digitalisierung historischer Zeitungen</title> | |
<style type="text/css">body,button{font-family:Verdana}.tooltip,button{display:inline-block}body{margin:auto;width:90%}p{text-align:justify}button{background-color:#fff;color:#000;width:185px;border:2px solid #87CEEB;padding:16px 32px;margin-left:32px;text-align:center;text-decoration:none;font-size:16px;border-radius:12px;-webkit-transition-duration:.4s;transition-duration:.4s}button:focus,button:hover{background-color:#87CEEB;outline:0!important;color:#fff}.container{width:100%;margin:0 auto}.frame{margin:0 auto;width:1120px;background-color:white}.left_column{float:left;width:23%}.right_column{background-color:#F0F0F0;float:left;width:71%;text-align:left;padding-left:10px;padding-right:10px}.header{text-align:center}.footer{text-align:right;clear:both}.code{font-family:Courier}.tooltip{position:relative;border-bottom:1px dotted #000}.tooltip .tooltiptext{visibility:hidden;width:140px;background-color:#87CEEB;color:#fff;font-size:14px;text-align:center;border-radius:6px;padding:5px 0;position:absolute;z-index:1;bottom:125%;left:50%;margin-left:-60px;opacity:0;transition:opacity 1s}.tooltip .tooltiptext::after{content:"";position:absolute;top:100%;left:50%;margin-left:-5px;border-width:5px;border-style:solid;border-color:#555 transparent transparent}.tooltip:hover .tooltiptext{visibility:visible;opacity:1}table{font-size:14px;border-collapse:collapse}tr,th,td{border:1px solid #000;text-align:left;padding:8px} | |
</style> | |
</head> | |
<body> | |
<br> | |
<div class="frame"> | |
<div class="header"> | |
<h2><span onclick="window.location.reload()">Wegweiser für die Digitalisierung historischer Zeitungen</span></h2> | |
</div> | |
<hr><br> | |
<div class="toc"> | |
<button id="1" onclick="toggle_container('w1');">Vorbereitung</button> | |
<button id="2" onclick="toggle_container('w2');">Digitalisierung</button> | |
<button id="3" onclick="toggle_container('w3');">Erschließung</button> | |
<button id="4" onclick="toggle_container('w4');">Bereitstellung</button> | |
<button id="5" onclick="toggle_container('w5');">Archivierung</button> | |
</div><br> | |
<div id="intro"> | |
<p>Sie interessieren sich für die Digitalisierung von Zeitungen? Dieser Wegweiser möchte Sie bei den wichtigsten Schritten Ihres Digitalisierungsprojekts begleiten und, wesentlich orientiert an den praktischen Arbeiten, konkrete Hilfestellungen geben. Die Grundlage der präsentierten Informationen und Empfehlungen stellt dabei der vom DFG-Pilotprojekt "<a href="http://gepris.dfg.de/gepris/projekt/225572475" target="_blank">Digitalisierung historischer Zeitungen</a>" erarbeitete <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf" target="_blank">Masterplan</a> dar.</p> | |
</div> | |
<div class="container" id="w1" style="display: none;"> | |
<div class="left_column"> | |
<button id="1a" onclick="toggle_content('w1_1a');">Digitalisierungs- standards</button><br><br> | |
<button id="1b" onclick="toggle_content('w1_1b');">Original oder Mikrofilm</button><br><br> | |
<button id="1c" onclick="toggle_content('w1_1c');">Inhouse vs. Outsourcing</button><br><br> | |
<button id="1d" onclick="toggle_content('w1_1d');">Kosten- kalkulation</button><br><br> | |
<button id="1e" onclick="toggle_content('w1_1e');">Vollständigkeits- prüfung</button><br><br> | |
<button id="1f" onclick="toggle_content('w1_1f');">ZDB</button> | |
</div> | |
<div class="right_column"> | |
<div class="content" id="w1_1a" style="display: none;"> | |
<p>Was bedeutet eigentlich "Digitalisierung" im konkreten Einzelfall? Bei der Digitalisierung von Zeitungen sind ganz unterschiedliche Bearbeitungsniveaus denkbar, die jeweils für sich einen Endpunkt darstellen oder als Schritt auf dem weiteren Bearbeitungsweg angesehen werden können. Abhängig von Ihren Zielen im Digitalisierungsprojekt, können die folgenden Bearbeitungsstufen (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=29&zoom=auto,69,183" target="_blank">Masterplan</a>, S. 28 ff.) aufeinander aufbauend sämtlich oder teilweise durchgeführt werden:</p> | |
<strong>Grundstandard</strong><br> | |
<ul> | |
<li>Stufe 1: Erzeugung von digitalen Abbildungen der Zeitungsseiten einschließlich Strukturdaten zur Ermöglichung einer einfachen Navigation seitens der Nutzer</li> | |
<li>Stufe 2: Erzeugung von <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Volltexten</li> | |
</ul> | |
<strong>Erweiterter Standard 1</strong><br> | |
<ul> | |
<li>Stufe 3a: (halb)automatische Artikelseparierung, manuelle Korrekturen von Überschriften</li> | |
<li>Stufe 3b: (halb)automatische Artikelseparierung, manuelle Erfassung von Überschriften</li> | |
</ul> | |
<strong>Erweiterter Standard 2</strong> | |
<ul> | |
<li>Stufe 4: Normdatenverknüpfung, Named Entity Recognition (NER)</li> | |
<li>Stufe 5: vertiefte sachliche Erschließung je nach Anforderung</li> | |
<li>Stufe 6: Bilderkennung und -erschließung</li> | |
</ul> | |
<p>Das minimale Ziel sollte das Erreichen des beschriebenen Grundstandards der Stufe 1 sein, über die übrigen Stufen ist im Einzelfall nach Vorlage und Bedarf zu entscheiden.</p> | |
</div> | |
<div class="content" id="w1_1b" style="display: none;"> | |
<p>Die Digitalisierung vom gedruckten Original ermöglicht eine Reproduktion in bester Faksimilequalität und vermittelt einen optimalen Gesamteindruck des Originals. Für eine spätere <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> sind die besten Voraussetzungen gegeben. Insbesondere unikale und seltene Zeitungen sowie Zeitungen von besonderem kulturhistorischem Wert, z.B. solche mit wichtigen Bildanteilen, sollten daher vom Original in Farbe oder in Graustufe gescannt werden. Allerdings ist dies auch die zeitaufwändigste und damit kostenträchtigste Vorgehensweise, unabhängig davon, ob inhouse oder mit einem Dienstleister gearbeitet wird.</p> | |
<p>Die Digitalisierung vom Mikrofilm, sofern vorhanden, schont die fragilen Originale. Gleichzeitig können die mit einer Verfilmung bereits durchgeführten Arbeiten (Verzeichnung, ggf. Lückenergänzung, vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=28&zoom=auto,69,340" target="_blank">Masterplan</a>, S. 27 f.) teilweise nachgenutzt werden. Eine Massendigitalisierung kann relativ schnell und preiswert erfolgen. Bei Verwendung hochwertiger Mikrofilme jüngeren Datums sind bei einer <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Bearbeitung vergleichbare Ergebnisse wie bei der Digitalisierung vom Original zu erwarten.</p> | |
<p>In jedem Fall muss vorab geprüft werden, ob die gewählte Vorlage – Papieroriginal oder Mikrofilm – für eine Digitalisierung geeignet ist. Bei der Digitalisierung vom Mikrofilm darf der Nachbearbeitungsauswand nicht vergessen oder unterschätzt werden. Abhängig von der Qualität der Vorlage/der Mikroverfilmung fallen mehr oder weniger zeitaufwändige Korrekturen der automatischen Seitenerkennung an.</p> | |
<p>Weitere Informationen und Bewertungskriterien zur dieser Frage können Sie dem <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=54&zoom=auto,69,604" target="_blank">Masterplan</a> (ab S. 53) sowie der gesonderten Entscheidungshilfe zur <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Entscheidungshilfe_Original_oder_Mikrofilm.pdf" target="_blank">Digitalisierung von Original oder Mikrofilm</a> entnehmen.</p> | |
</div> | |
<div class="content" id="w1_1c" style="display: none;"> | |
<p>Bei der Wahl zwischen einer Digitalisierung mit eigenem Personal und Equipment ("Inhouse") und einer Vergabe der Digitalisierung an einen Dienstleister ("Outsourcing") handelt es sich oftmals um eine Grundsatzentscheidung, bei der jenseits des einzelnen Projekts z.B. auch die strategische und personelle Ausrichtung einer Einrichtung eine wichtige Rolle spielen kann. Zahlreiche Faktoren sind von Bedeutung und werden je nach Ausgangslage und Zielvorstellung ganz anders zu gewichten sein.</p> | |
<p>Wird im eigenen Haus digitalisiert, sind nicht nur die unmittelbar anfallenden Ausgaben zu berücksichtigen, sondern auch die Folgekosten. Wartung, Reparaturen, Austausch von Geräten, Software-Updates und ähnliches erzeugen nicht nur häufig übersehene Kosten, sondern verursachen auch Stillstände in der Produktion. Auf der anderen Seite darf nicht vergessen werden, dass auch die Vergabe an einen Dienstleister erhebliche Ressourcen vor Ort bindet. So entstehen Aufwände durch Ausschreibungsverfahren, Definition der Anforderungen, Materialauswahl, -aushebung, -übergabe, Qualitätskontrolle der Lieferungen etc.</p> | |
<p>Bei der Abwägung Ihrer Entscheidung kann diese <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Checkliste_Digitalisierung_in-house_oder_mit_Dienstleister.pdf" target="_blank">Checkliste</a> nützlich sein.</p> | |
</div> | |
<div class="content" id="w1_1d" style="display: none;"> | |
<p>Die unterschiedlichen Verfahren, Workflows, Mengen, Schwierigkeitsgrade und Erschließungstiefen bei der Zeitungsdigitalisierung ergeben ein differenziert zu betrachtendes Kostenspektrum, das sich nur bedingt verallgemeinern lässt. Die ermittelten Kostenfaktoren (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=42&zoom=auto,69,358" target="_blank">Masterplan</a>, S. 41 ff.) in Abhängigkeit der entsprechenden Rahmenbedingungen sind dabei:</p> | |
<ul> | |
<li><strong>Aufgabenübergreifend</strong> | |
<ul> | |
<li>Projektleitung und –koordination</li> | |
</ul></li> | |
<li><strong>Vorbereitung</strong> | |
<ul> | |
<li>Auswahl der zu digitalisierenden Inhalte und Abgleich mit der <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span></li> | |
<li>Beschaffung der Vorlagen</li> | |
<li>Prüfung der Vorlagenqualität und Entscheidung für eine Vorlagenart (Original vs. Mikrofilm)</li> | |
<li>Kollationierung bzw. Prüfung der Vollständigkeit und konservatorischen Eignung</li> | |
<li>Inhouse-Digitalisierung und/oder <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Bearbeitung/Tiefenerschließung: Prüfung der Eignung vorhandener Ausrüstung bzw. ggf. Beschaffung/Aufrüstung von Scannern und Software</li> | |
<li>Vergabe an Dienstleister (Digitalisierung und/oder <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Bearbeitung bzw. Tiefenerschließung): Vorbereitung und Durchführung eines Vergabeverfahrens</li> | |
<li>Vorbereitung der Materialien: ggf. Lückenschluss, konservatorische Maßnahmen</li> | |
<li>Workflowplanung und Kostenkalkulation</li> | |
</ul></li> | |
<li><strong>Digitalisierung</strong> | |
<ul> | |
<li>Art des Scannereinsatzes und Komplexität des Digitalisierungsvorgangs</li> | |
<li>Qualitätskontrolle (bei Inhouse-Digitalisierung und in Zusammenarbeit mit dem Dienstleister)</li> | |
</ul></li> | |
<li><strong>Erschließung</strong> | |
<ul> | |
<li>Bibliographische Erschließung</li> | |
<li>Strukturdatenerschließung</li> | |
<li><span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> (Antiqua, Fraktur)</li> | |
<li>Layouterkennung / Artikelseparierung</li> | |
</ul></li> | |
<li><strong>Bereitstellung</strong> | |
<ul> | |
<li>Einbindung in Präsentationsoberfläche / DFG-Viewer, ggf. mit Einrichtung entsprechender Schnittstellen</li> | |
</ul></li> | |
<li><strong>Archivierung</strong> | |
<ul> | |
<li>Herstellung persistenter Adressierbarkeit</li> | |
<li>Datensicherung / Langzeitarchivierung</li> | |
</ul></li> | |
</ul> | |
<p>Der Medientyp Zeitung zeichnet sich durch eine ausgeprägte Heterogenität in Bezug auf die physische und strukturelle Beschaffenheit der Vorlagen aus. Für die konkrete Planung von Zeitungsdigitalisierungsprojekten wird empfohlen, nach der Bestandsprüfung das zu wählende Digitalisierungsverfahren abzuleiten und mittels Marktsichtungen (z.B. Scanner; Dienstleister), aktualisierten Informationen (z.B. <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Lizenzkosten) sowie Stichproben (v.a. zur Ermittlung des Personalbedarfs für Erfassung, Qualitätskontrolle etc.) den Kostenrahmen des Projektes anhand des entsprechenden Mengengerüstes zu kalkulieren.</p> | |
<p>Detailliertere Informationen zu den im Rahmen des Pilotprojekts ermittelten Kostenkorridoren lassen sich im <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=45&zoom=auto,69,775" target="_blank">Masterplan</a> (S. 44) finden.</p> | |
</div> | |
<div class="content" id="w1_1e" style="display: none;"> | |
<p>Vollständigkeit sollte ein wichtiges Ziel jedes Digitalisierungsprojekts sein. Damit kann einerseits die Vollständigkeit aller Ausgaben eines Zeitungstitels gemeint sein. Andererseits wird, insbesondere bei größeren, langlebigen Zeitungsunternehmungen, lediglich die Vollständigkeit eines festzusetzenden Erscheinungszeitraums anzustreben sein. Im Idealfall enthalten die erzeugten Digitalisate des gewählten Titels oder Zeitraums jede bekannte gedruckte Seite, deren Existenz bspw. durch durchgehende Seiten- oder Ausgabenzählung bekannt ist oder angenommen werden darf (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=28&zoom=auto,69,340" target="_blank">Masterplan</a>, S. 27 f.).</p> | |
<p>Vor Beginn der Digitalisierung sollte deshalb die Vollständigkeit der zu digitalisierenden Zeitungen geprüft werden. Werden Lücken im eigenen Bestand identifiziert, können fehlende Bestandsteile, sofern in anderen Einrichtungen vorhanden, über entsprechende Recherchen in der <a href="http://beta.zdb-katalog.de/" target="_blank"><span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span></a> gefunden werden. Eine eigens für einen einrichtungsübergreifenden Bestandsvergleich eingerichtete Visualisierung bietet einen schnellen und präzisen Überblick. Im Fall der Digitalisierung vom Mikrofilm prüfen Sie zusätzlich die im <a href="http://www.mfa-dortmund.de/" target="_blank">Mikrofilmarchiv der deutschsprachigen Presse e.V.</a> und im <a href="https://www.eromm.org/" target="_blank">EROMM-Register</a> nachgewiesenen Bestände.</p> | |
</div> | |
<div class="content" id="w1_1f" style="display: none;"> | |
<p>Die <a href="http://beta.zdb-katalog.de" target="_blank">Zeitschriftendatenbank (ZDB)</a> ist das wichtigste Erfassungs- und Nachweisinstrument für Zeitschriften, Zeitungen und andere Periodika in Deutschland und Österreich und wurde im Rahmen des Projekts zum wissenschaftsfreundlichen Nachweis- und Steuerungsinstrument weiterentwickelt (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=12&zoom=auto,69,500" target="_blank">Masterplan</a>, S. 11 ff.). Es eröffnet den Zugang zu den Beständen von mehr als 4.000 Kultur- und Wissenschaftseinrichtungen.</p> | |
<p>Bitte beachten Sie, dass die <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> keine Präsentationsumgebung für Bilddateien oder Volltexte ist.</p> | |
<p>Im Kontext von Zeitungsdigitalisierungsprojekten in Deutschland erfüllt die <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> mehrere wichtige Funktionen:</p> | |
<ul> | |
<li>als Rechercheinstrument zur Klärung der Bestandslage und zur Identifizierung möglicher Partnereinrichtungen im Fall von existierenden Bestandslücken in der digitalisierenden Einrichtung</li> | |
<li>als Ort der Bekanntmachung geplanter Digitalisierungen zur Vermeidung von Doppelarbeit</li> | |
<li>als Ort der Katalogisierung der digitalisierten Zeitungen</li> | |
<li>als Instrument der verstärkten Sichtbarmachung und Benutzerzuführung zu den digitalen Sammlungen der digitalisierenden Einrichtungen</li> | |
<li>als übergreifendes Rechercheinstrument mit zahlreichen modernen Such-, Stöber- und Visualisierungsfunktionen für Endnutzer</li> | |
<li>als Datenprovider bei späteren Portalisierungen digitaler Zeitungsbestände etwa in der <a href="https://www.deutsche-digitale-bibliothek.de/" target="_blank">Deutschen Digitalen Bibliothek</a> oder in der <a href="http://www.europeana.eu/" target="_blank">Europeana</a>.</li> | |
</ul> | |
<p>Die jeweiligen Funktionen der <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> werden an den entsprechenden Textstellen dieses Wegweisers sowie umfänglich im <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=56&zoom=auto,69,297" target="_blank">Masterplan</a> ab S. 55 erläutert.</p> | |
</div> | |
</div> | |
</div> | |
<div class="container" id="w2" style="display: none;"> | |
<div class="left_column"> | |
<button id="2a" onclick="toggle_content('w2_2a');">Bilddateien</button><br><br> | |
<button id="2b" onclick="toggle_content('w2_2b');">Struktur- und Metadaten</button><br><br> | |
<button id="2c" onclick="toggle_content('w2_2c');">Volltexte</button><br><br> | |
<button id="2d" onclick="toggle_content('w2_2d');">Qualitäts- kontrolle: <em>Digitalisierung</em></button> | |
</div> | |
<div class="right_column"> | |
<div class="content" id="w2_2a" style="display: none;"> | |
<ul> | |
<li><p><a href="https://de.wikipedia.org/wiki/Tagged_Image_File_Format" target="_blank"><span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span></a><br>Bildmaster von Graustufen oder Farbbildern sollten nach dem derzeitigen Kenntnisstand im Format "<strong><span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span> uncompressed</strong>" langzeitgesichert werden. Das Format <span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span> gibt es schon seit den 1980er Jahren. Es hat sich als einer der wichtigsten de-facto-Standards etabliert und es ist damit zu rechnen, dass es auch in Zukunft von allen Standardprogrammen unterstützt wird. So haben auch die Projektpartner durchgängig <span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span> in ihren Zeitungsdigitalisierungsprojekten genutzt (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=41&zoom=auto,69,318" target="_blank">Masterplan</a>, S. 40 f.). Neben <span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span> kann auch <span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span>-<span class="tooltip">LZW<span class="tooltiptext">Lempel-Ziv-Welch</span></span> oder JPEG2000 in seiner <strong>verlustfreien Form</strong> als Format für den Bildmaster verwendet werden.</p></li> | |
<li><p><a href="https://de.wikipedia.org/wiki/JPEG_2000" target="_blank">JPEG2000</a><br>Im internationalen Umfeld hat sich JPEG2000 in den letzten Jahren zu einer ernst zu nehmenden Alternative für <span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span> entwickelt (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=42&zoom=auto,69,505" target="_blank">Masterplan</a>, S. 41). Vorteile sind vor allem der geringere Speicherplatzbedarf durch verlustfreie/-behaftete Kompression und der insbesondere für großformatige Zeitungen praktische Zoom in gängigen Web-Browsern. Inzwischen existiert mit <a href="https://github.com/uclouvain/openjpeg" target="_blank">OpenJPEG</a> auch eine quelloffene Referenzimplementierung des "Part 1" der JPEG2000-Spezifikation. Für die Speicherung von Mastern im JPEG2000-Format ist daher darauf zu achten, dass nur die lizenzfreien Bereiche von JPEG2000 Verwendung finden.</p></li> | |
</ul> | |
<p><strong>Für die Digitalisierung von Zeitungen wird eine Auflösung von 300<span class="tooltip">ppi<span class="tooltiptext">Pixel-per-inch</span></span> und eine Farbtiefe von mindestens 8-Bit (256 Graustufen) im Format TIFF empfohlen.</strong></p> | |
</div> | |
<div class="content" id="w2_2b" style="display: none;"> | |
<ul> | |
<li><p><a href="http://www.loc.gov/standards/mets/" target="_blank"><span class="tooltip">METS<span class="tooltiptext">Metadata Encoding and Transmission Standard</span></span></a>/<a href="http://www.loc.gov/standards/mods/" target="_blank"><span class="tooltip">MODS<span class="tooltiptext">Metadata Object Description Schema</span></span></a><br>Die Bereitstellung der Metadaten zur weiteren Nutzung gemäß den materialspezifischen Standards ist verpflichtend: Die <a href="http://www.dfg.de/formulare/12_151/" target="_blank">DFG-Praxisregeln "Digitalisierung"</a> sehen dabei für gedruckte Textwerke die Nutzung von <span class="tooltip">METS<span class="tooltiptext">Metadata Encoding and Transmission Standard</span></span>/<span class="tooltip">MODS<span class="tooltiptext">Metadata Object Description Schema</span></span> vor.</p></li> | |
<li><p><a href="http://www.europeana-newspapers.eu/wp-content/uploads/2015/05/D5.3_Final_release_ENMAP_1.0.pdf" target="_blank"><span class="tooltip">ENMAP<span class="tooltiptext">Europeana Newspapers METS/ALTO Profile</span></span></a><br><span class="tooltip">ENMAP<span class="tooltiptext">Europeana Newspapers METS/ALTO Profile</span></span> ist ein <span class="tooltip">METS<span class="tooltiptext">Metadata Encoding and Transmission Standard</span></span>/<span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> Profil für Zeitungen das vom <a href="http://www.europeana-newspapers.eu/" target="_blank">Europeana Newspapers</a> Projekt entwickelt wurde und das insbesondere nützliche Hinweise für eine Feinstrukturierung der formalen und inhaltlichen Zeitungsbestandsteile enthält. Bitte beachten Sie jedoch, dass aufwendige Feinstrukturierungen möglicherweise ausschließlich in lokalen Umgebungen Mehrwerte erbringen und in überregionalen Nachweisinstrumenten (z.B. <span class="tooltip">DDB<span class="tooltiptext">Deutsche Digitale Bibliothek</span></span>, Europeana) nicht nachgenutzt werden können.</p></li> | |
</ul> | |
<p><strong>Für Meta- und Strukturdaten von digitalisierten Zeitungen wird die Verwendung von <span class="tooltip">METS<span class="tooltiptext">Metadata Encoding and Transmission Standard</span></span>/<span class="tooltip">MODS<span class="tooltiptext">Metadata Object Description Schema</span></span> empfohlen.</strong></p> | |
</div> | |
<div class="content" id="w2_2c" style="display: none;"> | |
<ul> | |
<li><p><a href="http://www.loc.gov/standards/alto/" target="_blank"><span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span></a><br>Für Volltexte hat sich <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> als de-facto-Standard etabliert. <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> wird von der Library of Congress gepflegt und ist ein speziell für die Anforderungen von <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> und <span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span> entwickeltes XML-Schema in dem u.a. pixelgenaue Koordinaten für die erkannten Zeichen und Layoutelemente sowie Konfidenzwerte der Erkennungsqualität abgelegt werden können.</p></li> | |
<li><p><a href="http://www.tei-c.org/index.xml" target="_blank"><span class="tooltip">TEI<span class="tooltiptext">Text Encoding Initiative</span></span></a><br>Neben <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> hat sich - vor allem im Bereich der Wissenschaft - <span class="tooltip">TEI<span class="tooltiptext">Text Encoding Initiative</span></span> als Standard für die Kodierung auszuzeichnender Volltexte durchgesetzt, das auch die Erfassung von Koordinaten und typographischen Merkmalen erlaubt.</p></li> | |
<li><p><a href="http://kba.github.io/hocr-spec/1.2/" target="_blank">hOCR</a><br> Schließlich sei auch noch hOCR genannt, welches u.a. bei der Digitalisierung im Rahmen von Google Books Projekten sowie in diversen Open Source OCR Softwareprogrammen Verwendung findet.</p></li> | |
</ul> | |
<p><strong>Für Zeitungsvolltexte wird die Verwendung von <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> empfohlen.</strong></p> | |
</div> | |
<div class="content" id="w2_2d" style="display: none;"> | |
<p>Eine Qualitätskontrolle der Digitalisierung sollte mindestens stichprobenhaft durchgeführt werden (siehe dazu auch den <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=40&zoom=auto,69,513" target="_blank">Masterplan</a>, S. 39 ff.). Die zu prüfenden Aspekte sind:</p> | |
<ul> | |
<li><strong>Scanparameter</strong> - sind Kontrast/Farbe optimal auch über mehrere Zeitungen hinweg?</li> | |
<li><strong>Technische Parameter</strong> - wurden die Digitalisierungsparameter eingehalten?</li> | |
<li><strong>Lesbarkeit</strong> - sind die Texte gut lesbar?</li> | |
<li><strong>Ausrichtung</strong> - sind alle Seiten gerade ausgerichtet?</li> | |
<li><strong>Vollständigkeit</strong> - sind Bilddateien für alle Zeitungsseiten der Vorlageform vorhanden?</li> | |
<li><strong>Reihenfolge</strong> - liegen alle Bilddateien in der korrekten Reihenfolge vor?</li> | |
</ul> | |
<p>Speziell bei der Digitalisierung vom Mikrofilm ist darüber hinaus auf Folgendes zu achten:</p> | |
<ul> | |
<li><strong>Rahmensetzung</strong> - sind alle Seiten erkannt und die Rahmen korrekt gesetzt worden?</li> | |
<li><strong>Dubletten</strong> - sind bei der Digitalisierung überflüssige, d.h. dublette Seiten erfasst worden?<br> | |
(Anmerkung: dies kommt vor allem bei Mikrofilmen vor, auf denen einzelne schwer lesbare Seiten häufig mit verschiedenen technischen Parametern verfilmt wurden, um die Lesbarkeit der Texte zu gewährleisten)</li> | |
</ul> | |
</div> | |
</div> | |
</div> | |
<div class="container" id="w3" style="display: none;"> | |
<div class="left_column"> | |
<button id="3a" onclick="toggle_content('w3_3a');">Grundstandard (Stufe 1)</button><br><br> | |
<button id="3b" onclick="toggle_content('w3_3b');">Texterkennung (OCR)</button><br><br> | |
<button id="3c" onclick="toggle_content('w3_3c');">Layoutanalyse (OLR)</button><br><br> | |
<button id="3d" onclick="toggle_content('w3_3d');">Tiefen- erschließung</button><br><br> | |
<button id="3e" onclick="toggle_content('w3_3e');">ZDB- Erschließung</button><br><br> | |
<button id="3f" onclick="toggle_content('w3_3f');">Qualitäts- kontrolle: <em>Erschließung</em></button> | |
</div> | |
<div class="right_column"> | |
<div class="content" id="w3_3a" style="display: none;"> | |
<p>Wie bereits an anderer Stelle erwähnt wurde, kann die Erschließungstiefe von digitalisierten Zeitungen mit unterschiedlichen legitimen Begründungen von Projekt zu Projekt differieren.</p> | |
<p>Zunächst aber zu den Gemeinsamkeiten. Aus der Publikationslogik von Zeitungen – Titel, Jahrgang, Ausgabe, Seite – ergibt sich der Bedarf einer spezifischen Präsentation in online-Umgebungen. Üblicherweise wird mindestens eine Kalenderfunktion (Jahr, Monat, Tag) angeboten, mit der Ausgaben einzelner Titel tagesgenau angesteuert werden können. Um dies zu ermöglichen, sollten die entsprechenden Termini des <a href="http://dfg-viewer.de/strukturdatenset/" target="_blank">Strukturdatensets des DFG-Viewers</a> verwendet werden.</p> | |
<p>Allen Digitalisierungsprojekten gemein ist somit Stufe 1 des <strong>Grundstandards</strong> der Erschließung (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=29&zoom=auto,69,183" target="_blank">Masterplan</a>, S. 28 ff.): Erzeugung von digitalen Abbildungen der Zeitungsseiten einschließlich Strukturdaten zur Ermöglichung einer einfachen Navigation seitens der Nutzer.</p> | |
<p>Sind weitergehende Erschließungsarbeiten sinnvoll und erwünscht, so finden diese auf dem Weg der <strong>Tiefenerschließung</strong> statt.</p> | |
</div> | |
<div class="content" id="w3_3b" style="display: none;"> | |
<p>Texterkennung - oder auch <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> - bezeichnet die automatisierte Erkennung des Textes innerhalb von Bildern. Texterkennung ist notwendig, da Scanner oder Digitalkameras als Ergebnis ausschließlich Rastergrafiken liefern können, d.h. in Zeilen und Spalten angeordnete Punkte unterschiedlicher Färbung (Pixel). Texterkennung bezeichnet dabei die Aufgabe, die so dargestellten Buchstaben als solche zu erkennen, d.h. zu identifizieren und ihnen den Wert zuzuordnen, der ihnen nach üblicher Textcodierung zukommt (<a href="https://de.wikipedia.org/wiki/Unicode" target="_blank">Unicode</a>).</p> | |
<p>Insbesondere im Bereich älterer historischer Zeitungen ist damit zu rechnen, dass die Ergebnisse einer <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Bearbeitung nicht vollständig korrekt sein werden. Zu den typischen Gründen dafür gehören mindere Papier- und/oder Druckqualitäten oder qualitativ schlechte Mikrofilme, im Extremfall Textverluste bereits in der Vorlage, während der Digitalisierung erzeugte Phänomene (z.B. Seitenwölbungen), schwer lesbare bzw. erkennbare Textbereiche (z.B. Impressum, Tabellen, Diagramme etc.) sowie uneinheitliche Schrifttypen gerade im Bereich der Frakturschrift. Welche Ergebnisse letztlich als qualitativ ausreichend akzeptiert werden kann, hängt von einigen oder all diesen Faktoren ab.</p> | |
<p>Weitere Informationen zu <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> und zu erwartenden Qualitätsstufen entnehmen Sie bitte dem <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=32&zoom=auto,69,483" target="_blank">Masterplan</a> (S. 31 ff.).</p> | |
</div> | |
<div class="content" id="w3_3c" style="display: none;"> | |
<p>Layoutanalyse oder auch <span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span> bezeichnet die automatisierte Erkennung der Struktur eines Dokuments bzw. einer Seite. Die Layoutanalyse kann als integraler Bestandteil der <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> durchgeführt werden oder als separater bzw. nachträglicher Bearbeitungsschritt.</p> | |
<p>Insbesondere bei Zeitungen spielt die Qualität der <span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span> eine entscheidende Rolle, um z.B. Spalten und Artikel zu erkennen und so die Lesbarkeit einzelner logischer Elemente auf einer Seite zu bewahren. Gerade für historische Zeitungen besteht hier jedoch noch Entwicklungsbedarf, z.B. hinsichtlich der Erkennung und Klassifikation von unterschiedlichen Regionen (Artikel, Werbung, Metainformationen wie Preis und Herausgeber, grafische Elemente und Abbildungen, Tabellen, usw.).</p> | |
</div> | |
<div class="content" id="w3_3d" style="display: none;"> | |
<p>Neben der unbedingt durchzuführenden Erzeugung von Struktur- und Metadaten, die den erwähnen Erschließungs-Grundstandard bilden, und die Navigation innerhalb der Zeitungssammlung ermöglichen, können die Digitalisate tiefergehender und granularer erschlossen werden (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=30&zoom=auto,69,165" target="_blank">Masterplan</a>, S. 29 f.).</p> | |
<p>Jenseits von <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> und <span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span> sind weitere Arbeitsschritte denkbar: Automatische Auswertung typographischer Merkmale (z.B. zur Erfassung von Schlagzeilen), Erfassung oder Korrekturen von Überschriften, Bilderkennung und -erschließung, semantische Anreicherungen usw.</p> | |
<p>Die hier unter Vorbereitung/Digitalisierung beschriebenen Bearbeitungsstufen stellen eine Empfehlung dar und sind nicht im Sinne von Ausschließlichkeit zu verstehen. Allerdings ist zu beachten, dass eine granulare Erschließung auch eine granulare Such- und Präsentationsumgebung benötigt, um die mit viel Aufwand erzeugten Datenfacetten oder -anreicherungen auch angemessen recherchierbar und darstellbar zu machen.</p> | |
</div> | |
<div class="content" id="w3_3e" style="display: none;"> | |
<p>Die <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> ist ein wichtiges Katalogisierungs- und Nachweisinstrument im Kontext der Zeitungsdigitalisierung in Deutschland. Bevor Sie die Arbeit beginnen, sollte Ihr Vorhaben in der <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> angekündigt bzw. dokumentiert werden, damit Doppelarbeit vermieden werden kann. Nach Abschluss der Digitalisierung sollten die Nachweise der Digitalisate ebenfalls in der <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> erfasst und nachgewiesen werden.</p> | |
<p>Von den bibliographischen Titeldatensätzen der <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> aus können Benutzer direkt in die lokalen oder überregionalen Rechercheumgebungen geleitet werden. Somit unterstützt die <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> die Sichtbarkeit Ihrer digitalen Bestände in ganz erheblicher Weise.</p> | |
<p>Für digitalisierende Einrichtungen stellt die <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> detaillierte Erfassungsanweisungen zur Verfügung, die sie <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Hinweise_zur_Katalogisierung_in_der_ZDB.pdf" target="_blank">hier</a> einsehen können.</p> | |
</div> | |
<div class="content" id="w3_3f" style="display: none;"> | |
<p>Zur Qualitätskontrolle der Erschließung bieten sich die folgenden Verfahren an:</p> | |
<ul> | |
<li><strong>Grundstandard</strong> - eine Überprüfung des Grundstandards der Erschließung kann bspw. vor der Veröffentlichung im Web erfolgen, indem stichprobenhaft einzelne Ausgaben via Kalender aufgerufen und die Seiten durchgeblättert werden.</li> | |
<li><strong><span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span></strong> - Eine Kontrolle der Qualität von <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> lässt sich bspw. durch eine Evaluation mittels sog. "Ground Truth" (manuell erzeugte, zu 100% korrekte Transkriptionen des Text und Layouts eines Dokuments/einer Seite) ermitteln. Die Erstellung geeigneten Ground Truth-Materials ist jedoch mit erheblichem Aufwand verbunden. Weitere Informationen und Werkzeuge für die <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> Evaluation mit Ground Truth sind im <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=32&zoom=auto,69,483" target="_blank">Masterplan</a> (S. 31 ff.) sowie <a href="https://sites.google.com/site/textdigitisation/qualitymeasures" target="_blank">hier</a> zu finden (Englisch).</li> | |
<li><strong><span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span></strong> - Analog zur Qualitätskontrolle der <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> lassen sich auch die Ergebnisse von <span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span> mit Ground Truth evaluieren. Hierbei ist insbesondere auf eine an den Benutzeranforderungen orientierte Evaluation zu achten.</li> | |
</ul> | |
</div> | |
</div> | |
</div> | |
<div class="container" id="w4" style="display: none;"> | |
<div class="left_column"> | |
<button id="4a" onclick="toggle_content('w4_4a');">Präsentation</button><br><br> | |
<button id="4b" onclick="toggle_content('w4_4b');">DFG-Viewer</button><br><br> | |
<button id="4c" onclick="toggle_content('w4_4c');">Schnittstellen</button><br><br> | |
<button id="4d" onclick="toggle_content('w4_4d');">Persistenz</button> | |
</div> | |
<div class="right_column"> | |
<div class="content" id="w4_4a" style="display: none;"> | |
<p>Digitalisierte Zeitungen sind ein ganz besonderes Material, das spezifische Anforderungen an die digitalen Recherche- und Präsentationsumgebungen stellt. Selbst wenn nach dem Grundstandard Stufe 1 (Erzeugung von digitalen Abbildungen einschließlich Strukturdaten) erschlossen wird, wird mindestens eine Kalenderfunktion zur Navigation benötigt. Eine weitergehende Erschließung erfordert weitere Funktionen - die <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Erschließung erfordert einen Ort zur Darstellung der Texte, Textauszeichnungen müssen nachvollziehbar dargestellt werden können, semantische Anreicherungen müssen gefunden und verstanden werden können, und nicht zuletzt erfordern die originalen Zeitungsformate und die Größe moderner Bildschirme eine Zoomfunktion. Es ist zu bedenken, dass solche spezifischen Umgebungen nicht ohne erhebliche Aufwände geschaffen werden können.</p> | |
<p>So naheliegend es ist, bei der Verwertung der erzeugten Daten zunächst Ihre eigenen Online-Umgebungen und -Services im Auge zu halten, so sollte doch auch daran gedacht werden, dass mit Ihren Zeitungsdaten in der Regel umso sinnvoller gearbeitet werden kann, je größer die durchsuchbaren Datenmengen sind. Mit anderen Worten: digitale Daten aus Zeitungssammlungen anderer Einrichtungen erhöhen den Nutzen Ihrer eigenen Sammlung. Ein gemeinsamer, überregionaler Nachweis liegt also durchaus im Interesse der einzelnen digitalisierenden Einrichtung.</p> | |
<p>Für einen solchen überregionalen Nachweis sind Schnittstellen von großer Bedeutung, mittels derer die entsprechenden Portale, z.B. die <span class="tooltip">DDB<span class="tooltiptext">Deutsche Digitale Bibliothek</span></span>, Ihre Daten automatisiert einsammeln können (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=59&zoom=auto,69,765" target="_blank">Masterplan</a>, S. 58 f.). Zunehmend stellen die Kultur- und Wissenschaftseinrichtungen ihre Daten über geeignete Schnittstellen aber auch Endnutzern zur Verfügung. Insbesondere im Bereich der Digital Humanities favorisieren viele Endnutzer den Download der angebotenen Daten, um diese in eigenen digitalen Umgebungen optimal analysieren zu können.</p> | |
</div> | |
<div class="content" id="w4_4b" style="display: none;"> | |
<p>Der <a href="http://dfg-viewer.de/" target="_blank">DFG-Viewer</a> ist ein Browser-Webdienst zur Anzeige von Digitalisaten aus dezentralen Bibliotheksrepositorien. Im Rahmen des DFG-Pilotprojekts zur Digitalisierung historischer Zeitungen wurde der DFG-Viewer um Funktionen für die speziellen Erfordernisse des Gattungstyps Zeitungen erweitert (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=17&zoom=auto,69,430" target="_blank">Masterplan</a>, S. 16 ff.). Diese umfassen:</p> | |
<ul> | |
<li>generische Umsetzung der dreistufigen Kalendernavigation (Titel, Jahrgang, Ausgabe)</li> | |
<li>stufenloser Zoom für alle Zeitungsformate über <a href="https://openlayers.org/" target="_blank">OpenLayers</a></li> | |
<li>freie Bildpositionierung (Panning) über <a href="https://openlayers.org/" target="_blank">OpenLayers</a></li> | |
<li>verteilte Volltextsuche (<span class="tooltip">SRU<span class="tooltiptext">Search and Retrieval via URL</span></span>-Schnittstelle, <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span>-Format)</li> | |
<li>Überarbeitung der <a href="http://dfg-viewer.de/profil-der-metadaten/" target="_blank">Formatdokumentationen</a> für <span class="tooltip">METS<span class="tooltiptext">Metadata Encoding and Transmission Standard</span></span> und <span class="tooltip">MODS<span class="tooltiptext">Metadata Object Description Schema</span></span></li> | |
<li>Erstellung von Beispielen für den <a href="http://dfg-viewer.de/demo/" target="_blank">Demonstrator</a></li> | |
</ul> | |
<p>Der Quellcode des DFG-Viewers wurde auf der Entwicklungsplattform <a href="https://github.com/slub/dfg-viewer" target="_blank">GitHub</a> unter der Open-Source-Lizenz <span class="tooltip">GPL<span class="tooltiptext">GNU Public License</span></span>3 veröffentlicht und kann frei nachgenutzt werden. Der von der SLUB Dresden betriebene DFG-Viewer ist ein freier Webdienst, der ohne lokale Installation verwendet werden kann. | |
</p> | |
</div> | |
<div class="content" id="w4_4c" style="display: none;"> | |
<p>Die Bereitstellung der Digitalisate sollte über die reine Präsentation im Webportal hinaus auch über geeignete Schnittstellen, zudem möglichst ohne rechtliche Beschränkungen hinsichtlich der Nutzbarkeit, erfolgen. Schnittstellen, über die Daten bereitgestellt werden, dienen mindestens zwei Zwecken:</p> | |
<ul> | |
<li><p>Bereitstellung der Daten für Endnutzer.<br>Insbesondere im Bereich der Digital Humanities favorisieren viele Endnutzer den Download der angebotenen Daten, um diese in eigenen digitalen Umgebungen optimal analysieren zu können.</p></li> | |
<li><p>Überregionale Nachweisportale, z.B. die <span class="tooltip">DDB<span class="tooltiptext">Deutsche Digitale Bibliothek</span></span>, können Ihre Daten über Schnittstellen automatisiert einsammeln.</p></li> | |
</ul> | |
<p>Gängige Schnittstellenprotokolle sind:</p> | |
<ul> | |
<li><p><a href="https://www.openarchives.org/pmh/" target="_blank"><span class="tooltip">OAI-PMH<span class="tooltiptext">Open Archives Initiative Protocol for Metadata Harvesting</span></span></a> für die Bereitstellung von Metadaten. Die Bereitstellung der deskriptiven Metadaten über eine <span class="tooltip">OAI-PMH<span class="tooltiptext">Open Archives Initiative Protocol for Metadata Harvesting</span></span>-Schnittstelle ist verpflichtend, wahlweise im eigenen System oder über ein geeignetes Zielportal.</p></li> | |
<li><p><a href="http://www.loc.gov/standards/sru/" target="_blank"><span class="tooltip">SRU<span class="tooltiptext">Search and Retrieval via URL</span></span></a> für die Bereitstellung von durchsuchbaren Volltexten. Liegen die Volltexte im Format <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> vor, so unterstützt der DFG-Viewer die Volltextsuche via <span class="tooltip">SRU<span class="tooltiptext">Search and Retrieval via URL</span></span>.</p></li> | |
<li><p><a href="http://iiif.io/" target="_blank"><span class="tooltip">IIIF<span class="tooltiptext">International Image Interoperability Framework</span></span></a> ist ein relativ neuer Standard für die Bereitstellung von <a href="http://iiif.io/api/image/2.1/" target="_blank">Images</a>, <a href="http://iiif.io/api/search/1.0/" target="_blank">Volltexten</a> und <a href="http://iiif.io/api/presentation/2.1/" target="_blank">Annotationen</a>.</p></li> | |
</ul> | |
</div> | |
<div class="content" id="w4_4d" style="display: none;"> | |
<p>Digitalisate müssen, um von anderen Objekten oder Datenbanken aus erreichbar zu sein, eindeutig angesprochen werden können. Dazu ist über die übliche Zitierform hinaus, die durch ein Angebot in der Navigationssoftware als klassische Form weitergenutzt werden kann und sollte, die Festlegung und die online zugängliche Dokumentation von Adressierungstechniken erforderlich. Sichergestellt werden müssen die Erreichbarkeit und Zitierbarkeit einer Ressource als Ganzes und die Erreichbarkeit und Zitierbarkeit von einzelnen physischen Seiten dieses Werkes.</p> | |
<p>Die <a href="http://www.dfg.de/formulare/12_151/" target="_blank">DFG-Praxisregeln "Digitalisierung"</a> fordern die Sicherstellung einer persistenten Adressierbarkeit der online bereitgestellten Ressourcen mit einer "größtmögliche[n] Granularität". Hierbei können verschiedene Persistenz-Verfahren genutzt werden (<span class="tooltip">PURL<span class="tooltiptext">Persistent Uniform Resource Locator</span></span>, <span class="tooltip">URN<span class="tooltiptext">Uniform Resource Name</span></span>, <span class="tooltip">DOI<span class="tooltiptext">Digital Object Identifier</span></span>, Handle etc.). Die Nutzung von <span class="tooltip">URN<span class="tooltiptext">Uniform Resource Name</span></span>s wird jedoch von den Praxisregeln "nachdrücklich empfohlen".</p> | |
<p>Das 2009 von der Deutschen Nationalbibliothek und der ULB Halle erarbeitete Verfahren <strong>URN granular</strong> bedient sich einer Adressierungstechnik, die auf die granulare Adressierung monographischer Werke unter Maßgabe der oben zitierten Anforderungen der DFG-Praxisregeln abzielt. Die Nutzung dieses Verfahrens bei der Adressierung komplexerer Objekte ist jedoch nur eingeschränkt möglich. Basierend auf einem Konzept, das in der generellen RFC-Spezifikation zu URIs als "fragment identifier component of a URI" bezeichnet wird, wurde daher <strong>URN granular 2</strong> entwickelt, um den komplexeren Herausforderungen bei der Bereitstellung und Adressierung von digitalisierten Zeitungen Rechnung zu tragen.</p> | |
<p>Eine andere Methode sind <strong><span class="tooltip">DOI<span class="tooltiptext">Digital Object Identifier</span></span></strong>s, die eindeutige und dauerhafte Identifikatoren für digitale Ressourcen bereitstellen und in der Praxis vor allem für die Referenzierung von Artikeln wissenschaftlicher Fachzeitschriften verwendet werden. Das <span class="tooltip">DOI<span class="tooltiptext">Digital Object Identifier</span></span>-System kennt granulare Adressierungstechniken für den Zugriff auf Teile von digitalen Ressourcen, wie sie für das Verfahren URN granular 2 beschrieben wurden. Weitere Details hierzu finden Sie auch im <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=38&zoom=auto,69,450" target="_blank">Masterplan</a> auf S. 37 ff.</p> | |
</div> | |
</div> | |
</div> | |
<div class="container" id="w5" style="display: none;"> | |
<div class="left_column"> | |
<button id="5a" onclick="toggle_content('w5_5a');">Langzeit- archivierung</button> | |
</div> | |
<div class="right_column"> | |
<div class="content" id="w5_5a" style="display: none;"> | |
<p>Die Langzeitarchivierung der in einem Projekt entstehenden Digitalisate ist eine der grundlegenden Bedingungen, die für eine Förderfähigkeit gestellt werden. Damit ist nicht nur die Sicherung der entstehenden Dateien vor Kompromittierung oder Verlust gemeint, sondern auch ihre stabile Adressierung und Zitierbarkeit im Netz, zuverlässige Zugangssysteme und komfortable Nachnutzungsmöglichkeiten. Hinzu kommt die langfristige Sicherung der Nutzbarkeit der Dateien in zukünftigen Systemumgebungen, die andere Dateiformate als die heute verbreiteten voraussetzen: Es müssen rechtzeitig Migrationen in andere Formate vorgenommen werden, die über die erforderlichen Features für die Nutzung der Dateien verfügen. Auch andere Formen der langfristigen Absicherung der Nutzbarkeit der Daten sind denkbar.</p> | |
<p>In der Regel wird eine digitalisierende Einrichtung diese Aufgabe nicht selbst übernehmen, sondern an einen geeigneten Dienstleister übergeben. Dabei ist es wichtig, in der vertraglichen Vereinbarung mit diesem die Anforderungen an die Qualität der Langzeitarchivierung zu vereinbaren und Sicherheit darüber zu erlangen, welche wechselseitigen Leistungen erwartet werden. Es empfiehlt sich, eine solche Vereinbarung bereits im Vorfeld eines Digitalisierungsprojekts abzuschließen, um sich daraus ergebende Vorbedingungen insbesondere für die Aufbereitung der im Projekt entstehenden Daten bereits frühzeitig festlegen zu können.</p> | |
<p>In Deutschland hat sich zur Beratung und wechselseitigen Unterstützung das <a href="http://www.langzeitarchivierung.de/" target="_blank">nestor-Netzwerk</a> etabliert, in dem auch alle wesentlichen Anbieter von Dienstleistungen auf dem Gebiet der Langzeitverfügbarkeit vertreten sind. Ein wichtiger Indikator für die Vertrauenswürdigkeit eines Archivservices ist daher auch die Zertifizierung des jeweiligen Archivs, die mit dem "<a href="http://www.langzeitarchivierung.de/Subsites/nestor/DE/Siegel/siegel_node.html" target="_blank">nestor-Siegel</a>" dokumentiert wird.</p> | |
</div> | |
</div> | |
</div> | |
<div class="footer"> | |
<br><hr> Gefördert durch die <a href="http://www.dfg.de/" target="_blank"><img src="data:image/gif;base64,R0lGODlh+gAfAMQAAIiu0n+ozu7z+d3o8szc7EB9thFdpDN0sWaXxSJoq3eiy1WLvqrF35m52J+92u/0+b/T5xBcpGCTw1CIvM/e7d/p8zBysHCdya/I4Y+z1CBnqrvR5UR/uABRnv///wAAACH5BAAAAAAALAAAAAD6AB8AAAX/IBSMZGmWUOWtbHu+8Oi09Po4UtHtPF9MAcijRiwaj8ikcslsOp/GQG9KpVoyw1p1uy0YIRPuNsAkbM4DqFPRULvfcLdUTO9EZrQ63Vuj6PRTZEscCRwcHQcEThwATIxxkJGSNHOAXBJ5llV8LQ6agY6NHgIAHYqhqJOqq1CVn1QZLa9TnCsSszyCSo8sABwrCgYdCAIebCsEvw0Ghb8MCR0GCCsAwgcbHAoIHQmnxsLErOLirrg8KivmO7UZ6h26SbwrAx0DCgsCAhzTvBsdHgMOIEDTgQHABcYOpGngK8EGDwsOAMOnb9q4i5LKqcOUTh0nCO7epWLRwV8aDwwM/3jo92+lKH/FVggo2IJlupMpMercuaKCRipZxNRKYqFOBAkYsqyg4CAMPCTy0vkzxOHAP5suZTJTYNAfDZtTDVnlSRajJzF4hDLBUGeCUiIPKIz0QKBgyTNnsnrwqneUL0R8WYC9i7esYXF/tnBUuySMGI6Soi5AQO+k4JctoyLr0MBUTcwA6x0eLa4dFz6MlexZ1S9iMQ4IR7VBEHvbisnIHo6qB3seA6y9ZZMeHgekmI5dlhjnIlfVoR0JAMQMWEgaXQMHBLbcYIAQAWYcDDSifqgBVvLWiav34KCA+/fw4dJBXiUC/PvvL3hgy8XCYTMxjbJBgDJtcIoZltE1IP8SAK633k88FDGfB+54AeEO+jmo4YarXNiSFsdR6JEHHj7F4YkoOuGhhCFWSKIYJtI3RYo0nrgiERO6eNYYLFZR448O3khDBTmOuFwVGYLooxJm4LVgHMcAeQQBCa7RhhK+cOCNkC0cSUUEMr7ixQNi+IfjFoM0Y4g3b2gm5VeiQOEmEQAkwMBvonDJwgWMpZaEBmKgk8mS8cQZmaFvTjJnDbzwoqcHD0QgRoZ+IsEnFxOcSShUiAqwzTAxsfEbAc9EY1E1gGWzTTfAXJkMMACs6o0C0SzwC0rQpEerAbayEAyoxvzFgQC0sgoMOMUco0Cs3JxSanqoXqNqs8dGo4D/B8tUBx4Hej5QlBgQhNnDUEcQiZaSVAwyUGEIHJAPbit1BwA9Bg2AkAIKYdvQQxGtAJxDEEmU0ACk/EPvQQMXPFE++8T7UHiNACDwPQzz0wgh/Ep0sL0D64txwNQoMoABDQQ0EAECnVEiCRdIKoYGJJ3WxC1iTNAcpFykSdWwntHVwWvX7vUzCzMZdNkKfAEH2kyneAUT0T3zJRpKKvHiC9ItTZ3TI4MFWPRnWLcgwAYHXCyKoyHxgIeIyTFRgcvuDGJoYBQ+LIoAW3X1ob+g6ZU0aIF5hXcCXAnNgtMdUDWW1bcirvhVZoc9eOF0+70dNAeIpxfaaZsprg9O8Bf3/y5z711SX6Qccs3elvMdduuBt5Q6YB8i7qTd1DT+jz+3Z4XV7KvDKbkBQXN9dp5pR3Az25s8saM5crdQ2TyiuVlXZ2wq/bpN0xvewvVTe9X90R5cbfj4rmPFAvjZA/6h8a6/6I7ygzbvPNyzRF+TRQjcyosZMuFNbAaAp9fRZgW2ad1KpmGvfwBwNwNoWAP9FRsBtIFx26vgBSNnuAfOJIIDLOD5RPMdDsLLQ3pwC7qoQK4lVCAxr9Df+hKQHWP9DzyaIw9nsPKd7CSQh4cgnANx2IhkcINW8zhAdSyWu9ehh4k2+U51xqPE8mAFAd3JDge5QwgUcuEoy5OFzNwAhmNXeE4NeTECgr73pCKMjUBJYIDAFFQllMxRQXBkUBv1mKAGqZFNNBgbAUQQAxg4IIw1KOTa3HADCXzrSwWQQBDekigaAEABG5AjonqBSU1W8pOg5MkG+reAKxFhlLAxZShrEAIAOw==" alt="dfg_logo"></a> | |
</div> | |
</div> | |
<script type="text/javascript">function toggle_container(e){var n=document.getElementById(e),t=document.getElementsByClassName("container"),l=document.getElementsByClassName("content");document.getElementById("intro").style.display="none",[].forEach.call(t,function(e){e!==n?e.style.display="none":n.style.display="none"===n.style.display?"block":"none"}),[].forEach.call(l,function(e){e.style.display="none"})}function toggle_content(e){var n=document.getElementById(e),t=document.getElementsByClassName("content");[].forEach.call(t,function(e){e!==n?e.style.display="none":n.style.display="none"===n.style.display?"block":"none"})}</script> | |
</body> | |
</html> |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment