Skip to content

Instantly share code, notes, and snippets.

@cneud
Last active June 15, 2017 14:26
Show Gist options
  • Save cneud/2e4f8a5352133ba5296c647409791636 to your computer and use it in GitHub Desktop.
Save cneud/2e4f8a5352133ba5296c647409791636 to your computer and use it in GitHub Desktop.
DFG Zeitungsdigitalisierung Wegweiser Workflow interaktiv
<!DOCTYPE html>
<html lang="de">
<head>
<meta charset="UTF-8">
<meta name=viewport content="width=device-width, initial-scale=1">
<title>Digitalisierung historischer Zeitungen</title>
<style type="text/css">body,button{font-family:Verdana}.tooltip,button{display:inline-block}body{margin:auto;width:90%}p{text-align:justify}button{background-color:#fff;color:#000;width:185px;border:2px solid #87CEEB;padding:16px 32px;margin-left:32px;text-align:center;text-decoration:none;font-size:16px;border-radius:12px;-webkit-transition-duration:.4s;transition-duration:.4s}button:focus,button:hover{background-color:#87CEEB;outline:0!important;color:#fff}.container{width:100%;margin:0 auto}.frame{margin:0 auto;width:1120px;background-color:white}.left_column{float:left;width:23%}.right_column{background-color:#F0F0F0;float:left;width:71%;text-align:left;padding-left:10px;padding-right:10px}.header{text-align:center}.footer{text-align:right;clear:both}.code{font-family:Courier}.tooltip{position:relative;border-bottom:1px dotted #000}.tooltip .tooltiptext{visibility:hidden;width:140px;background-color:#87CEEB;color:#fff;font-size:14px;text-align:center;border-radius:6px;padding:5px 0;position:absolute;z-index:1;bottom:125%;left:50%;margin-left:-60px;opacity:0;transition:opacity 1s}.tooltip .tooltiptext::after{content:"";position:absolute;top:100%;left:50%;margin-left:-5px;border-width:5px;border-style:solid;border-color:#555 transparent transparent}.tooltip:hover .tooltiptext{visibility:visible;opacity:1}table{font-size:14px;border-collapse:collapse}tr,th,td{border:1px solid #000;text-align:left;padding:8px}
</style>
</head>
<body>
<br>
<div class="frame">
<div class="header">
<h2><span onclick="window.location.reload()">Wegweiser f&uuml;r die Digitalisierung historischer Zeitungen</span></h2>
</div>
<hr><br>
<div class="toc">
<button id="1" onclick="toggle_container('w1');">Vorbereitung</button>
<button id="2" onclick="toggle_container('w2');">Digitalisierung</button>
<button id="3" onclick="toggle_container('w3');">Erschlie&szlig;ung</button>
<button id="4" onclick="toggle_container('w4');">Bereitstellung</button>
<button id="5" onclick="toggle_container('w5');">Archivierung</button>
</div><br>
<div id="intro">
<p>Sie interessieren sich f&uuml;r die Digitalisierung von Zeitungen? Dieser Wegweiser m&ouml;chte Sie bei den wichtigsten Schritten Ihres Digitalisierungsprojekts begleiten und, wesentlich orientiert an den praktischen Arbeiten, konkrete Hilfestellungen geben. Die Grundlage der pr&auml;sentierten Informationen und Empfehlungen stellt dabei der vom DFG-Pilotprojekt "<a href="http://gepris.dfg.de/gepris/projekt/225572475" target="_blank">Digitalisierung historischer Zeitungen</a>" erarbeitete <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf" target="_blank">Masterplan</a> dar.</p>
</div>
<div class="container" id="w1" style="display: none;">
<div class="left_column">
<button id="1a" onclick="toggle_content('w1_1a');">Digitalisierungs- standards</button><br><br>
<button id="1b" onclick="toggle_content('w1_1b');">Original oder Mikrofilm</button><br><br>
<button id="1c" onclick="toggle_content('w1_1c');">Inhouse vs. Outsourcing</button><br><br>
<button id="1d" onclick="toggle_content('w1_1d');">Kosten- kalkulation</button><br><br>
<button id="1e" onclick="toggle_content('w1_1e');">Vollst&auml;ndigkeits- pr&uuml;fung</button><br><br>
<button id="1f" onclick="toggle_content('w1_1f');">ZDB</button>
</div>
<div class="right_column">
<div class="content" id="w1_1a" style="display: none;">
<p>Was bedeutet eigentlich "Digitalisierung" im konkreten Einzelfall? Bei der Digitalisierung von Zeitungen sind ganz unterschiedliche Bearbeitungsniveaus denkbar, die jeweils f&uuml;r sich einen Endpunkt darstellen oder als Schritt auf dem weiteren Bearbeitungsweg angesehen werden k&ouml;nnen. Abh&auml;ngig von Ihren Zielen im Digitalisierungsprojekt, k&ouml;nnen die folgenden Bearbeitungsstufen (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=29&zoom=auto,69,183" target="_blank">Masterplan</a>, S. 28 ff.) aufeinander aufbauend s&auml;mtlich oder teilweise durchgef&uuml;hrt werden:</p>
<strong>Grundstandard</strong><br>
<ul>
<li>Stufe 1: Erzeugung von digitalen Abbildungen der Zeitungsseiten einschlie&szlig;lich Strukturdaten zur Erm&ouml;glichung einer einfachen Navigation seitens der Nutzer</li>
<li>Stufe 2: Erzeugung von <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Volltexten</li>
</ul>
<strong>Erweiterter Standard 1</strong><br>
<ul>
<li>Stufe 3a: (halb)automatische Artikelseparierung, manuelle Korrekturen von &Uuml;berschriften</li>
<li>Stufe 3b: (halb)automatische Artikelseparierung, manuelle Erfassung von &Uuml;berschriften</li>
</ul>
<strong>Erweiterter Standard 2</strong>
<ul>
<li>Stufe 4: Normdatenverkn&uuml;pfung, Named Entity Recognition (NER)</li>
<li>Stufe 5: vertiefte sachliche Erschlie&szlig;ung je nach Anforderung</li>
<li>Stufe 6: Bilderkennung und -erschlie&szlig;ung</li>
</ul>
<p>Das minimale Ziel sollte das Erreichen des beschriebenen Grundstandards der Stufe 1 sein, &uuml;ber die &uuml;brigen Stufen ist im Einzelfall nach Vorlage und Bedarf zu entscheiden.</p>
</div>
<div class="content" id="w1_1b" style="display: none;">
<p>Die Digitalisierung vom gedruckten Original erm&ouml;glicht eine Reproduktion in bester Faksimilequalit&auml;t und vermittelt einen optimalen Gesamteindruck des Originals. F&uuml;r eine sp&auml;tere <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> sind die besten Voraussetzungen gegeben. Insbesondere unikale und seltene Zeitungen sowie Zeitungen von besonderem kulturhistorischem Wert, z.B. solche mit wichtigen Bildanteilen, sollten daher vom Original in Farbe oder in Graustufe gescannt werden. Allerdings ist dies auch die zeitaufw&auml;ndigste und damit kostentr&auml;chtigste Vorgehensweise, unabh&auml;ngig davon, ob inhouse oder mit einem Dienstleister gearbeitet wird.</p>
<p>Die Digitalisierung vom Mikrofilm, sofern vorhanden, schont die fragilen Originale. Gleichzeitig k&ouml;nnen die mit einer Verfilmung bereits durchgef&uuml;hrten Arbeiten (Verzeichnung, ggf. L&uuml;ckenerg&auml;nzung, vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=28&zoom=auto,69,340" target="_blank">Masterplan</a>, S. 27 f.) teilweise nachgenutzt werden. Eine Massendigitalisierung kann relativ schnell und preiswert erfolgen. Bei Verwendung hochwertiger Mikrofilme j&uuml;ngeren Datums sind bei einer <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Bearbeitung vergleichbare Ergebnisse wie bei der Digitalisierung vom Original zu erwarten.</p>
<p>In jedem Fall muss vorab gepr&uuml;ft werden, ob die gew&auml;hlte Vorlage – Papieroriginal oder Mikrofilm – f&uuml;r eine Digitalisierung geeignet ist. Bei der Digitalisierung vom Mikrofilm darf der Nachbearbeitungsauswand nicht vergessen oder untersch&auml;tzt werden. Abh&auml;ngig von der Qualit&auml;t der Vorlage/der Mikroverfilmung fallen mehr oder weniger zeitaufw&auml;ndige Korrekturen der automatischen Seitenerkennung an.</p>
<p>Weitere Informationen und Bewertungskriterien zur dieser Frage k&ouml;nnen Sie dem <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=54&zoom=auto,69,604" target="_blank">Masterplan</a> (ab S. 53) sowie der gesonderten Entscheidungshilfe zur <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Entscheidungshilfe_Original_oder_Mikrofilm.pdf" target="_blank">Digitalisierung von Original oder Mikrofilm</a> entnehmen.</p>
</div>
<div class="content" id="w1_1c" style="display: none;">
<p>Bei der Wahl zwischen einer Digitalisierung mit eigenem Personal und Equipment ("Inhouse") und einer Vergabe der Digitalisierung an einen Dienstleister ("Outsourcing") handelt es sich oftmals um eine Grundsatzentscheidung, bei der jenseits des einzelnen Projekts z.B. auch die strategische und personelle Ausrichtung einer Einrichtung eine wichtige Rolle spielen kann. Zahlreiche Faktoren sind von Bedeutung und werden je nach Ausgangslage und Zielvorstellung ganz anders zu gewichten sein.</p>
<p>Wird im eigenen Haus digitalisiert, sind nicht nur die unmittelbar anfallenden Ausgaben zu ber&uuml;cksichtigen, sondern auch die Folgekosten. Wartung, Reparaturen, Austausch von Ger&auml;ten, Software-Updates und &auml;hnliches erzeugen nicht nur h&auml;ufig &uuml;bersehene Kosten, sondern verursachen auch Stillst&auml;nde in der Produktion. Auf der anderen Seite darf nicht vergessen werden, dass auch die Vergabe an einen Dienstleister erhebliche Ressourcen vor Ort bindet. So entstehen Aufw&auml;nde durch Ausschreibungsverfahren, Definition der Anforderungen, Materialauswahl, -aushebung, -&uuml;bergabe, Qualit&auml;tskontrolle der Lieferungen etc.</p>
<p>Bei der Abw&auml;gung Ihrer Entscheidung kann diese <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Checkliste_Digitalisierung_in-house_oder_mit_Dienstleister.pdf" target="_blank">Checkliste</a> n&uuml;tzlich sein.</p>
</div>
<div class="content" id="w1_1d" style="display: none;">
<p>Die unterschiedlichen Verfahren, Workflows, Mengen, Schwierigkeitsgrade und Erschlie&szlig;ungstiefen bei der Zeitungsdigitalisierung ergeben ein differenziert zu betrachtendes Kostenspektrum, das sich nur bedingt verallgemeinern l&auml;sst. Die ermittelten Kostenfaktoren (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=42&zoom=auto,69,358" target="_blank">Masterplan</a>, S. 41 ff.) in Abh&auml;ngigkeit der entsprechenden Rahmenbedingungen sind dabei:</p>
<ul>
<li><strong>Aufgaben&uuml;bergreifend</strong>
<ul>
<li>Projektleitung und –koordination</li>
</ul></li>
<li><strong>Vorbereitung</strong>
<ul>
<li>Auswahl der zu digitalisierenden Inhalte und Abgleich mit der <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span></li>
<li>Beschaffung der Vorlagen</li>
<li>Pr&uuml;fung der Vorlagenqualit&auml;t und Entscheidung f&uuml;r eine Vorlagenart (Original vs. Mikrofilm)</li>
<li>Kollationierung bzw. Pr&uuml;fung der Vollst&auml;ndigkeit und konservatorischen Eignung</li>
<li>Inhouse-Digitalisierung und/oder <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Bearbeitung/Tiefenerschlie&szlig;ung: Pr&uuml;fung der Eignung vorhandener Ausr&uuml;stung bzw. ggf. Beschaffung/Aufr&uuml;stung von Scannern und Software</li>
<li>Vergabe an Dienstleister (Digitalisierung und/oder <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Bearbeitung bzw. Tiefenerschlie&szlig;ung): Vorbereitung und Durchf&uuml;hrung eines Vergabeverfahrens</li>
<li>Vorbereitung der Materialien: ggf. L&uuml;ckenschluss, konservatorische Ma&szlig;nahmen</li>
<li>Workflowplanung und Kostenkalkulation</li>
</ul></li>
<li><strong>Digitalisierung</strong>
<ul>
<li>Art des Scannereinsatzes und Komplexit&auml;t des Digitalisierungsvorgangs</li>
<li>Qualit&auml;tskontrolle (bei Inhouse-Digitalisierung und in Zusammenarbeit mit dem Dienstleister)</li>
</ul></li>
<li><strong>Erschlie&szlig;ung</strong>
<ul>
<li>Bibliographische Erschlie&szlig;ung</li>
<li>Strukturdatenerschlie&szlig;ung</li>
<li><span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> (Antiqua, Fraktur)</li>
<li>Layouterkennung / Artikelseparierung</li>
</ul></li>
<li><strong>Bereitstellung</strong>
<ul>
<li>Einbindung in Pr&auml;sentationsoberfl&auml;che / DFG-Viewer, ggf. mit Einrichtung entsprechender Schnittstellen</li>
</ul></li>
<li><strong>Archivierung</strong>
<ul>
<li>Herstellung persistenter Adressierbarkeit</li>
<li>Datensicherung / Langzeitarchivierung</li>
</ul></li>
</ul>
<p>Der Medientyp Zeitung zeichnet sich durch eine ausgepr&auml;gte Heterogenit&auml;t in Bezug auf die physische und strukturelle Beschaffenheit der Vorlagen aus. F&uuml;r die konkrete Planung von Zeitungsdigitalisierungsprojekten wird empfohlen, nach der Bestandspr&uuml;fung das zu w&auml;hlende Digitalisierungsverfahren abzuleiten und mittels Marktsichtungen (z.B. Scanner; Dienstleister), aktualisierten Informationen (z.B. <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Lizenzkosten) sowie Stichproben (v.a. zur Ermittlung des Personalbedarfs f&uuml;r Erfassung, Qualit&auml;tskontrolle etc.) den Kostenrahmen des Projektes anhand des entsprechenden Mengenger&uuml;stes zu kalkulieren.</p>
<p>Detailliertere Informationen zu den im Rahmen des Pilotprojekts ermittelten Kostenkorridoren lassen sich im <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=45&zoom=auto,69,775" target="_blank">Masterplan</a> (S. 44) finden.</p>
</div>
<div class="content" id="w1_1e" style="display: none;">
<p>Vollst&auml;ndigkeit sollte ein wichtiges Ziel jedes Digitalisierungsprojekts sein. Damit kann einerseits die Vollst&auml;ndigkeit aller Ausgaben eines Zeitungstitels gemeint sein. Andererseits wird, insbesondere bei gr&ouml;&szlig;eren, langlebigen Zeitungsunternehmungen, lediglich die Vollst&auml;ndigkeit eines festzusetzenden Erscheinungszeitraums anzustreben sein. Im Idealfall enthalten die erzeugten Digitalisate des gew&auml;hlten Titels oder Zeitraums jede bekannte gedruckte Seite, deren Existenz bspw. durch durchgehende Seiten- oder Ausgabenz&auml;hlung bekannt ist oder angenommen werden darf (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=28&zoom=auto,69,340" target="_blank">Masterplan</a>, S. 27 f.).</p>
<p>Vor Beginn der Digitalisierung sollte deshalb die Vollst&auml;ndigkeit der zu digitalisierenden Zeitungen gepr&uuml;ft werden. Werden L&uuml;cken im eigenen Bestand identifiziert, k&ouml;nnen fehlende Bestandsteile, sofern in anderen Einrichtungen vorhanden, &uuml;ber entsprechende Recherchen in der <a href="http://beta.zdb-katalog.de/" target="_blank"><span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span></a> gefunden werden. Eine eigens f&uuml;r einen einrichtungs&uuml;bergreifenden Bestandsvergleich eingerichtete Visualisierung bietet einen schnellen und pr&auml;zisen &Uuml;berblick. Im Fall der Digitalisierung vom Mikrofilm pr&uuml;fen Sie zus&auml;tzlich die im <a href="http://www.mfa-dortmund.de/" target="_blank">Mikrofilmarchiv der deutschsprachigen Presse e.V.</a> und im <a href="https://www.eromm.org/" target="_blank">EROMM-Register</a> nachgewiesenen Best&auml;nde.</p>
</div>
<div class="content" id="w1_1f" style="display: none;">
<p>Die <a href="http://beta.zdb-katalog.de" target="_blank">Zeitschriftendatenbank (ZDB)</a> ist das wichtigste Erfassungs- und Nachweisinstrument f&uuml;r Zeitschriften, Zeitungen und andere Periodika in Deutschland und &Ouml;sterreich und wurde im Rahmen des Projekts zum wissenschaftsfreundlichen Nachweis- und Steuerungsinstrument weiterentwickelt (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=12&zoom=auto,69,500" target="_blank">Masterplan</a>, S. 11 ff.). Es er&ouml;ffnet den Zugang zu den Best&auml;nden von mehr als 4.000 Kultur- und Wissenschaftseinrichtungen.</p>
<p>Bitte beachten Sie, dass die <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> keine Pr&auml;sentationsumgebung f&uuml;r Bilddateien oder Volltexte ist.</p>
<p>Im Kontext von Zeitungsdigitalisierungsprojekten in Deutschland erf&uuml;llt die <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> mehrere wichtige Funktionen:</p>
<ul>
<li>als Rechercheinstrument zur Kl&auml;rung der Bestandslage und zur Identifizierung m&ouml;glicher Partnereinrichtungen im Fall von existierenden Bestandsl&uuml;cken in der digitalisierenden Einrichtung</li>
<li>als Ort der Bekanntmachung geplanter Digitalisierungen zur Vermeidung von Doppelarbeit</li>
<li>als Ort der Katalogisierung der digitalisierten Zeitungen</li>
<li>als Instrument der verst&auml;rkten Sichtbarmachung und Benutzerzuf&uuml;hrung zu den digitalen Sammlungen der digitalisierenden Einrichtungen</li>
<li>als &uuml;bergreifendes Rechercheinstrument mit zahlreichen modernen Such-, St&ouml;ber- und Visualisierungsfunktionen f&uuml;r Endnutzer</li>
<li>als Datenprovider bei sp&auml;teren Portalisierungen digitaler Zeitungsbest&auml;nde etwa in der <a href="https://www.deutsche-digitale-bibliothek.de/" target="_blank">Deutschen Digitalen Bibliothek</a> oder in der <a href="http://www.europeana.eu/" target="_blank">Europeana</a>.</li>
</ul>
<p>Die jeweiligen Funktionen der <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> werden an den entsprechenden Textstellen dieses Wegweisers sowie umf&auml;nglich im <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=56&zoom=auto,69,297" target="_blank">Masterplan</a> ab S. 55 erl&auml;utert.</p>
</div>
</div>
</div>
<div class="container" id="w2" style="display: none;">
<div class="left_column">
<button id="2a" onclick="toggle_content('w2_2a');">Bilddateien</button><br><br>
<button id="2b" onclick="toggle_content('w2_2b');">Struktur- und Metadaten</button><br><br>
<button id="2c" onclick="toggle_content('w2_2c');">Volltexte</button><br><br>
<button id="2d" onclick="toggle_content('w2_2d');">Qualit&auml;ts- kontrolle: <em>Digitalisierung</em></button>
</div>
<div class="right_column">
<div class="content" id="w2_2a" style="display: none;">
<ul>
<li><p><a href="https://de.wikipedia.org/wiki/Tagged_Image_File_Format" target="_blank"><span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span></a><br>Bildmaster von Graustufen oder Farbbildern sollten nach dem derzeitigen Kenntnisstand im Format "<strong><span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span> uncompressed</strong>" langzeitgesichert werden. Das Format <span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span> gibt es schon seit den 1980er Jahren. Es hat sich als einer der wichtigsten de-facto-Standards etabliert und es ist damit zu rechnen, dass es auch in Zukunft von allen Standardprogrammen unterst&uuml;tzt wird. So haben auch die Projektpartner durchg&auml;ngig <span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span> in ihren Zeitungsdigitalisierungsprojekten genutzt (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=41&zoom=auto,69,318" target="_blank">Masterplan</a>, S. 40 f.). Neben <span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span> kann auch <span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span>-<span class="tooltip">LZW<span class="tooltiptext">Lempel-Ziv-Welch</span></span> oder JPEG2000 in seiner <strong>verlustfreien Form</strong> als Format f&uuml;r den Bildmaster verwendet werden.</p></li>
<li><p><a href="https://de.wikipedia.org/wiki/JPEG_2000" target="_blank">JPEG2000</a><br>Im internationalen Umfeld hat sich JPEG2000 in den letzten Jahren zu einer ernst zu nehmenden Alternative f&uuml;r <span class="tooltip">TIFF<span class="tooltiptext">Tagged Image File Format</span></span> entwickelt (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=42&zoom=auto,69,505" target="_blank">Masterplan</a>, S. 41). Vorteile sind vor allem der geringere Speicherplatzbedarf durch verlustfreie/-behaftete Kompression und der insbesondere f&uuml;r gro&szlig;formatige Zeitungen praktische Zoom in g&auml;ngigen Web-Browsern. Inzwischen existiert mit <a href="https://github.com/uclouvain/openjpeg" target="_blank">OpenJPEG</a> auch eine quelloffene Referenzimplementierung des "Part 1" der JPEG2000-Spezifikation. F&uuml;r die Speicherung von Mastern im JPEG2000-Format ist daher darauf zu achten, dass nur die lizenzfreien Bereiche von JPEG2000 Verwendung finden.</p></li>
</ul>
<p><strong>F&uuml;r die Digitalisierung von Zeitungen wird eine Aufl&ouml;sung von 300<span class="tooltip">ppi<span class="tooltiptext">Pixel-per-inch</span></span> und eine Farbtiefe von mindestens 8-Bit (256 Graustufen) im Format TIFF empfohlen.</strong></p>
</div>
<div class="content" id="w2_2b" style="display: none;">
<ul>
<li><p><a href="http://www.loc.gov/standards/mets/" target="_blank"><span class="tooltip">METS<span class="tooltiptext">Metadata Encoding and Transmission Standard</span></span></a>/<a href="http://www.loc.gov/standards/mods/" target="_blank"><span class="tooltip">MODS<span class="tooltiptext">Metadata Object Description Schema</span></span></a><br>Die Bereitstellung der Metadaten zur weiteren Nutzung gem&auml;&szlig; den materialspezifischen Standards ist verpflichtend: Die <a href="http://www.dfg.de/formulare/12_151/" target="_blank">DFG-Praxisregeln "Digitalisierung"</a> sehen dabei f&uuml;r gedruckte Textwerke die Nutzung von <span class="tooltip">METS<span class="tooltiptext">Metadata Encoding and Transmission Standard</span></span>/<span class="tooltip">MODS<span class="tooltiptext">Metadata Object Description Schema</span></span> vor.</p></li>
<li><p><a href="http://www.europeana-newspapers.eu/wp-content/uploads/2015/05/D5.3_Final_release_ENMAP_1.0.pdf" target="_blank"><span class="tooltip">ENMAP<span class="tooltiptext">Europeana Newspapers METS/ALTO Profile</span></span></a><br><span class="tooltip">ENMAP<span class="tooltiptext">Europeana Newspapers METS/ALTO Profile</span></span> ist ein <span class="tooltip">METS<span class="tooltiptext">Metadata Encoding and Transmission Standard</span></span>/<span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> Profil f&uuml;r Zeitungen das vom <a href="http://www.europeana-newspapers.eu/" target="_blank">Europeana Newspapers</a> Projekt entwickelt wurde und das insbesondere n&uuml;tzliche Hinweise f&uuml;r eine Feinstrukturierung der formalen und inhaltlichen Zeitungsbestandsteile enth&auml;lt. Bitte beachten Sie jedoch, dass aufwendige Feinstrukturierungen m&ouml;glicherweise ausschlie&szlig;lich in lokalen Umgebungen Mehrwerte erbringen und in &uuml;berregionalen Nachweisinstrumenten (z.B. <span class="tooltip">DDB<span class="tooltiptext">Deutsche Digitale Bibliothek</span></span>, Europeana) nicht nachgenutzt werden k&ouml;nnen.</p></li>
</ul>
<p><strong>F&uuml;r Meta- und Strukturdaten von digitalisierten Zeitungen wird die Verwendung von <span class="tooltip">METS<span class="tooltiptext">Metadata Encoding and Transmission Standard</span></span>/<span class="tooltip">MODS<span class="tooltiptext">Metadata Object Description Schema</span></span> empfohlen.</strong></p>
</div>
<div class="content" id="w2_2c" style="display: none;">
<ul>
<li><p><a href="http://www.loc.gov/standards/alto/" target="_blank"><span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span></a><br>F&uuml;r Volltexte hat sich <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> als de-facto-Standard etabliert. <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> wird von der Library of Congress gepflegt und ist ein speziell f&uuml;r die Anforderungen von <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> und <span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span> entwickeltes XML-Schema in dem u.a. pixelgenaue Koordinaten f&uuml;r die erkannten Zeichen und Layoutelemente sowie Konfidenzwerte der Erkennungsqualit&auml;t abgelegt werden k&ouml;nnen.</p></li>
<li><p><a href="http://www.tei-c.org/index.xml" target="_blank"><span class="tooltip">TEI<span class="tooltiptext">Text Encoding Initiative</span></span></a><br>Neben <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> hat sich - vor allem im Bereich der Wissenschaft - <span class="tooltip">TEI<span class="tooltiptext">Text Encoding Initiative</span></span> als Standard f&uuml;r die Kodierung auszuzeichnender Volltexte durchgesetzt, das auch die Erfassung von Koordinaten und typographischen Merkmalen erlaubt.</p></li>
<li><p><a href="http://kba.github.io/hocr-spec/1.2/" target="_blank">hOCR</a><br> Schlie&szlig;lich sei auch noch hOCR genannt, welches u.a. bei der Digitalisierung im Rahmen von Google Books Projekten sowie in diversen Open Source OCR Softwareprogrammen Verwendung findet.</p></li>
</ul>
<p><strong>F&uuml;r Zeitungsvolltexte wird die Verwendung von <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> empfohlen.</strong></p>
</div>
<div class="content" id="w2_2d" style="display: none;">
<p>Eine Qualit&auml;tskontrolle der Digitalisierung sollte mindestens stichprobenhaft durchgef&uuml;hrt werden (siehe dazu auch den <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=40&zoom=auto,69,513" target="_blank">Masterplan</a>, S. 39 ff.). Die zu pr&uuml;fenden Aspekte sind:</p>
<ul>
<li><strong>Scanparameter</strong> - sind Kontrast/Farbe optimal auch &uuml;ber mehrere Zeitungen hinweg?</li>
<li><strong>Technische Parameter</strong> - wurden die Digitalisierungsparameter eingehalten?</li>
<li><strong>Lesbarkeit</strong> - sind die Texte gut lesbar?</li>
<li><strong>Ausrichtung</strong> - sind alle Seiten gerade ausgerichtet?</li>
<li><strong>Vollst&auml;ndigkeit</strong> - sind Bilddateien f&uuml;r alle Zeitungsseiten der Vorlageform vorhanden?</li>
<li><strong>Reihenfolge</strong> - liegen alle Bilddateien in der korrekten Reihenfolge vor?</li>
</ul>
<p>Speziell bei der Digitalisierung vom Mikrofilm ist dar&uuml;ber hinaus auf Folgendes zu achten:</p>
<ul>
<li><strong>Rahmensetzung</strong> - sind alle Seiten erkannt und die Rahmen korrekt gesetzt worden?</li>
<li><strong>Dubletten</strong> - sind bei der Digitalisierung &uuml;berfl&uuml;ssige, d.h. dublette Seiten erfasst worden?<br>
(Anmerkung: dies kommt vor allem bei Mikrofilmen vor, auf denen einzelne schwer lesbare Seiten h&auml;ufig mit verschiedenen technischen Parametern verfilmt wurden, um die Lesbarkeit der Texte zu gew&auml;hrleisten)</li>
</ul>
</div>
</div>
</div>
<div class="container" id="w3" style="display: none;">
<div class="left_column">
<button id="3a" onclick="toggle_content('w3_3a');">Grundstandard (Stufe 1)</button><br><br>
<button id="3b" onclick="toggle_content('w3_3b');">Texterkennung (OCR)</button><br><br>
<button id="3c" onclick="toggle_content('w3_3c');">Layoutanalyse (OLR)</button><br><br>
<button id="3d" onclick="toggle_content('w3_3d');">Tiefen- erschlie&szlig;ung</button><br><br>
<button id="3e" onclick="toggle_content('w3_3e');">ZDB- Erschlie&szlig;ung</button><br><br>
<button id="3f" onclick="toggle_content('w3_3f');">Qualit&auml;ts- kontrolle: <em>Erschlie&szlig;ung</em></button>
</div>
<div class="right_column">
<div class="content" id="w3_3a" style="display: none;">
<p>Wie bereits an anderer Stelle erw&auml;hnt wurde, kann die Erschlie&szlig;ungstiefe von digitalisierten Zeitungen mit unterschiedlichen legitimen Begr&uuml;ndungen von Projekt zu Projekt differieren.</p>
<p>Zun&auml;chst aber zu den Gemeinsamkeiten. Aus der Publikationslogik von Zeitungen – Titel, Jahrgang, Ausgabe, Seite – ergibt sich der Bedarf einer spezifischen Pr&auml;sentation in online-Umgebungen. &Uuml;blicherweise wird mindestens eine Kalenderfunktion (Jahr, Monat, Tag) angeboten, mit der Ausgaben einzelner Titel tagesgenau angesteuert werden k&ouml;nnen. Um dies zu erm&ouml;glichen, sollten die entsprechenden Termini des <a href="http://dfg-viewer.de/strukturdatenset/" target="_blank">Strukturdatensets des DFG-Viewers</a> verwendet werden.</p>
<p>Allen Digitalisierungsprojekten gemein ist somit Stufe 1 des <strong>Grundstandards</strong> der Erschlie&szlig;ung (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=29&zoom=auto,69,183" target="_blank">Masterplan</a>, S. 28 ff.): Erzeugung von digitalen Abbildungen der Zeitungsseiten einschlie&szlig;lich Strukturdaten zur Erm&ouml;glichung einer einfachen Navigation seitens der Nutzer.</p>
<p>Sind weitergehende Erschlie&szlig;ungsarbeiten sinnvoll und erw&uuml;nscht, so finden diese auf dem Weg der <strong>Tiefenerschlie&szlig;ung</strong> statt.</p>
</div>
<div class="content" id="w3_3b" style="display: none;">
<p>Texterkennung - oder auch <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> - bezeichnet die automatisierte Erkennung des Textes innerhalb von Bildern. Texterkennung ist notwendig, da Scanner oder Digitalkameras als Ergebnis ausschlie&szlig;lich Rastergrafiken liefern k&ouml;nnen, d.h. in Zeilen und Spalten angeordnete Punkte unterschiedlicher F&auml;rbung (Pixel). Texterkennung bezeichnet dabei die Aufgabe, die so dargestellten Buchstaben als solche zu erkennen, d.h. zu identifizieren und ihnen den Wert zuzuordnen, der ihnen nach &uuml;blicher Textcodierung zukommt (<a href="https://de.wikipedia.org/wiki/Unicode" target="_blank">Unicode</a>).</p>
<p>Insbesondere im Bereich &auml;lterer historischer Zeitungen ist damit zu rechnen, dass die Ergebnisse einer <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Bearbeitung nicht vollst&auml;ndig korrekt sein werden. Zu den typischen Gr&uuml;nden daf&uuml;r geh&ouml;ren mindere Papier- und/oder Druckqualit&auml;ten oder qualitativ schlechte Mikrofilme, im Extremfall Textverluste bereits in der Vorlage, w&auml;hrend der Digitalisierung erzeugte Ph&auml;nomene (z.B. Seitenw&ouml;lbungen), schwer lesbare bzw. erkennbare Textbereiche (z.B. Impressum, Tabellen, Diagramme etc.) sowie uneinheitliche Schrifttypen gerade im Bereich der Frakturschrift. Welche Ergebnisse letztlich als qualitativ ausreichend akzeptiert werden kann, h&auml;ngt von einigen oder all diesen Faktoren ab.</p>
<p>Weitere Informationen zu <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> und zu erwartenden Qualit&auml;tsstufen entnehmen Sie bitte dem <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=32&zoom=auto,69,483" target="_blank">Masterplan</a> (S. 31 ff.).</p>
</div>
<div class="content" id="w3_3c" style="display: none;">
<p>Layoutanalyse oder auch <span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span> bezeichnet die automatisierte Erkennung der Struktur eines Dokuments bzw. einer Seite. Die Layoutanalyse kann als integraler Bestandteil der <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> durchgef&uuml;hrt werden oder als separater bzw. nachtr&auml;glicher Bearbeitungsschritt.</p>
<p>Insbesondere bei Zeitungen spielt die Qualit&auml;t der <span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span> eine entscheidende Rolle, um z.B. Spalten und Artikel zu erkennen und so die Lesbarkeit einzelner logischer Elemente auf einer Seite zu bewahren. Gerade f&uuml;r historische Zeitungen besteht hier jedoch noch Entwicklungsbedarf, z.B. hinsichtlich der Erkennung und Klassifikation von unterschiedlichen Regionen (Artikel, Werbung, Metainformationen wie Preis und Herausgeber, grafische Elemente und Abbildungen, Tabellen, usw.).</p>
</div>
<div class="content" id="w3_3d" style="display: none;">
<p>Neben der unbedingt durchzuf&uuml;hrenden Erzeugung von Struktur- und Metadaten, die den erw&auml;hnen Erschlie&szlig;ungs-Grundstandard bilden, und die Navigation innerhalb der Zeitungssammlung erm&ouml;glichen, k&ouml;nnen die Digitalisate tiefergehender und granularer erschlossen werden (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=30&zoom=auto,69,165" target="_blank">Masterplan</a>, S. 29 f.).</p>
<p>Jenseits von <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> und <span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span> sind weitere Arbeitsschritte denkbar: Automatische Auswertung typographischer Merkmale (z.B. zur Erfassung von Schlagzeilen), Erfassung oder Korrekturen von &Uuml;berschriften, Bilderkennung und -erschlie&szlig;ung, semantische Anreicherungen usw.</p>
<p>Die hier unter Vorbereitung/Digitalisierung beschriebenen Bearbeitungsstufen stellen eine Empfehlung dar und sind nicht im Sinne von Ausschlie&szlig;lichkeit zu verstehen. Allerdings ist zu beachten, dass eine granulare Erschlie&szlig;ung auch eine granulare Such- und Pr&auml;sentationsumgebung ben&ouml;tigt, um die mit viel Aufwand erzeugten Datenfacetten oder -anreicherungen auch angemessen recherchierbar und darstellbar zu machen.</p>
</div>
<div class="content" id="w3_3e" style="display: none;">
<p>Die <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> ist ein wichtiges Katalogisierungs- und Nachweisinstrument im Kontext der Zeitungsdigitalisierung in Deutschland. Bevor Sie die Arbeit beginnen, sollte Ihr Vorhaben in der <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> angek&uuml;ndigt bzw. dokumentiert werden, damit Doppelarbeit vermieden werden kann. Nach Abschluss der Digitalisierung sollten die Nachweise der Digitalisate ebenfalls in der <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> erfasst und nachgewiesen werden.</p>
<p>Von den bibliographischen Titeldatens&auml;tzen der <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> aus k&ouml;nnen Benutzer direkt in die lokalen oder &uuml;berregionalen Rechercheumgebungen geleitet werden. Somit unterst&uuml;tzt die <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> die Sichtbarkeit Ihrer digitalen Best&auml;nde in ganz erheblicher Weise.</p>
<p>F&uuml;r digitalisierende Einrichtungen stellt die <span class="tooltip">ZDB<span class="tooltiptext">Zeitschriften- datenbank</span></span> detaillierte Erfassungsanweisungen zur Verf&uuml;gung, die sie <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Hinweise_zur_Katalogisierung_in_der_ZDB.pdf" target="_blank">hier</a> einsehen k&ouml;nnen.</p>
</div>
<div class="content" id="w3_3f" style="display: none;">
<p>Zur Qualit&auml;tskontrolle der Erschlie&szlig;ung bieten sich die folgenden Verfahren an:</p>
<ul>
<li><strong>Grundstandard</strong> - eine &Uuml;berpr&uuml;fung des Grundstandards der Erschlie&szlig;ung kann bspw. vor der Ver&ouml;ffentlichung im Web erfolgen, indem stichprobenhaft einzelne Ausgaben via Kalender aufgerufen und die Seiten durchgebl&auml;ttert werden.</li>
<li><strong><span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span></strong> - Eine Kontrolle der Qualit&auml;t von <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> l&auml;sst sich bspw. durch eine Evaluation mittels sog. "Ground Truth" (manuell erzeugte, zu 100% korrekte Transkriptionen des Text und Layouts eines Dokuments/einer Seite) ermitteln. Die Erstellung geeigneten Ground Truth-Materials ist jedoch mit erheblichem Aufwand verbunden. Weitere Informationen und Werkzeuge f&uuml;r die <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> Evaluation mit Ground Truth sind im <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=32&zoom=auto,69,483" target="_blank">Masterplan</a> (S. 31 ff.) sowie <a href="https://sites.google.com/site/textdigitisation/qualitymeasures" target="_blank">hier</a> zu finden (Englisch).</li>
<li><strong><span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span></strong> - Analog zur Qualit&auml;tskontrolle der <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span> lassen sich auch die Ergebnisse von <span class="tooltip">OLR<span class="tooltiptext">Optical Layout Recognition</span></span> mit Ground Truth evaluieren. Hierbei ist insbesondere auf eine an den Benutzeranforderungen orientierte Evaluation zu achten.</li>
</ul>
</div>
</div>
</div>
<div class="container" id="w4" style="display: none;">
<div class="left_column">
<button id="4a" onclick="toggle_content('w4_4a');">Pr&auml;sentation</button><br><br>
<button id="4b" onclick="toggle_content('w4_4b');">DFG-Viewer</button><br><br>
<button id="4c" onclick="toggle_content('w4_4c');">Schnittstellen</button><br><br>
<button id="4d" onclick="toggle_content('w4_4d');">Persistenz</button>
</div>
<div class="right_column">
<div class="content" id="w4_4a" style="display: none;">
<p>Digitalisierte Zeitungen sind ein ganz besonderes Material, das spezifische Anforderungen an die digitalen Recherche- und Pr&auml;sentationsumgebungen stellt. Selbst wenn nach dem Grundstandard Stufe 1 (Erzeugung von digitalen Abbildungen einschlie&szlig;lich Strukturdaten) erschlossen wird, wird mindestens eine Kalenderfunktion zur Navigation ben&ouml;tigt. Eine weitergehende Erschlie&szlig;ung erfordert weitere Funktionen - die <span class="tooltip">OCR<span class="tooltiptext">Optical Character Recognition</span></span>-Erschlie&szlig;ung erfordert einen Ort zur Darstellung der Texte, Textauszeichnungen m&uuml;ssen nachvollziehbar dargestellt werden k&ouml;nnen, semantische Anreicherungen m&uuml;ssen gefunden und verstanden werden k&ouml;nnen, und nicht zuletzt erfordern die originalen Zeitungsformate und die Gr&ouml;&szlig;e moderner Bildschirme eine Zoomfunktion. Es ist zu bedenken, dass solche spezifischen Umgebungen nicht ohne erhebliche Aufw&auml;nde geschaffen werden k&ouml;nnen.</p>
<p>So naheliegend es ist, bei der Verwertung der erzeugten Daten zun&auml;chst Ihre eigenen Online-Umgebungen und -Services im Auge zu halten, so sollte doch auch daran gedacht werden, dass mit Ihren Zeitungsdaten in der Regel umso sinnvoller gearbeitet werden kann, je gr&ouml;&szlig;er die durchsuchbaren Datenmengen sind. Mit anderen Worten: digitale Daten aus Zeitungssammlungen anderer Einrichtungen erh&ouml;hen den Nutzen Ihrer eigenen Sammlung. Ein gemeinsamer, &uuml;berregionaler Nachweis liegt also durchaus im Interesse der einzelnen digitalisierenden Einrichtung.</p>
<p>F&uuml;r einen solchen &uuml;berregionalen Nachweis sind Schnittstellen von gro&szlig;er Bedeutung, mittels derer die entsprechenden Portale, z.B. die <span class="tooltip">DDB<span class="tooltiptext">Deutsche Digitale Bibliothek</span></span>, Ihre Daten automatisiert einsammeln k&ouml;nnen (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=59&zoom=auto,69,765" target="_blank">Masterplan</a>, S. 58 f.). Zunehmend stellen die Kultur- und Wissenschaftseinrichtungen ihre Daten &uuml;ber geeignete Schnittstellen aber auch Endnutzern zur Verf&uuml;gung. Insbesondere im Bereich der Digital Humanities favorisieren viele Endnutzer den Download der angebotenen Daten, um diese in eigenen digitalen Umgebungen optimal analysieren zu k&ouml;nnen.</p>
</div>
<div class="content" id="w4_4b" style="display: none;">
<p>Der <a href="http://dfg-viewer.de/" target="_blank">DFG-Viewer</a> ist ein Browser-Webdienst zur Anzeige von Digitalisaten aus dezentralen Bibliotheksrepositorien. Im Rahmen des DFG-Pilotprojekts zur Digitalisierung historischer Zeitungen wurde der DFG-Viewer um Funktionen f&uuml;r die speziellen Erfordernisse des Gattungstyps Zeitungen erweitert (vgl. <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=17&zoom=auto,69,430" target="_blank">Masterplan</a>, S. 16 ff.). Diese umfassen:</p>
<ul>
<li>generische Umsetzung der dreistufigen Kalendernavigation (Titel, Jahrgang, Ausgabe)</li>
<li>stufenloser Zoom f&uuml;r alle Zeitungsformate &uuml;ber <a href="https://openlayers.org/" target="_blank">OpenLayers</a></li>
<li>freie Bildpositionierung (Panning) &uuml;ber <a href="https://openlayers.org/" target="_blank">OpenLayers</a></li>
<li>verteilte Volltextsuche (<span class="tooltip">SRU<span class="tooltiptext">Search and Retrieval via URL</span></span>-Schnittstelle, <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span>-Format)</li>
<li>&Uuml;berarbeitung der <a href="http://dfg-viewer.de/profil-der-metadaten/" target="_blank">Formatdokumentationen</a> f&uuml;r <span class="tooltip">METS<span class="tooltiptext">Metadata Encoding and Transmission Standard</span></span> und <span class="tooltip">MODS<span class="tooltiptext">Metadata Object Description Schema</span></span></li>
<li>Erstellung von Beispielen f&uuml;r den <a href="http://dfg-viewer.de/demo/" target="_blank">Demonstrator</a></li>
</ul>
<p>Der Quellcode des DFG-Viewers wurde auf der Entwicklungsplattform <a href="https://github.com/slub/dfg-viewer" target="_blank">GitHub</a> unter der Open-Source-Lizenz <span class="tooltip">GPL<span class="tooltiptext">GNU Public License</span></span>3 ver&ouml;ffentlicht und kann frei nachgenutzt werden. Der von der SLUB Dresden betriebene DFG-Viewer ist ein freier Webdienst, der ohne lokale Installation verwendet werden kann.
</p>
</div>
<div class="content" id="w4_4c" style="display: none;">
<p>Die Bereitstellung der Digitalisate sollte &uuml;ber die reine Pr&auml;sentation im Webportal hinaus auch &uuml;ber geeignete Schnittstellen, zudem m&ouml;glichst ohne rechtliche Beschr&auml;nkungen hinsichtlich der Nutzbarkeit, erfolgen. Schnittstellen, &uuml;ber die Daten bereitgestellt werden, dienen mindestens zwei Zwecken:</p>
<ul>
<li><p>Bereitstellung der Daten f&uuml;r Endnutzer.<br>Insbesondere im Bereich der Digital Humanities favorisieren viele Endnutzer den Download der angebotenen Daten, um diese in eigenen digitalen Umgebungen optimal analysieren zu k&ouml;nnen.</p></li>
<li><p>&Uuml;berregionale Nachweisportale, z.B. die <span class="tooltip">DDB<span class="tooltiptext">Deutsche Digitale Bibliothek</span></span>, k&ouml;nnen Ihre Daten &uuml;ber Schnittstellen automatisiert einsammeln.</p></li>
</ul>
<p>G&auml;ngige Schnittstellenprotokolle sind:</p>
<ul>
<li><p><a href="https://www.openarchives.org/pmh/" target="_blank"><span class="tooltip">OAI-PMH<span class="tooltiptext">Open Archives Initiative Protocol for Metadata Harvesting</span></span></a> f&uuml;r die Bereitstellung von Metadaten. Die Bereitstellung der deskriptiven Metadaten &uuml;ber eine <span class="tooltip">OAI-PMH<span class="tooltiptext">Open Archives Initiative Protocol for Metadata Harvesting</span></span>-Schnittstelle ist verpflichtend, wahlweise im eigenen System oder &uuml;ber ein geeignetes Zielportal.</p></li>
<li><p><a href="http://www.loc.gov/standards/sru/" target="_blank"><span class="tooltip">SRU<span class="tooltiptext">Search and Retrieval via URL</span></span></a> f&uuml;r die Bereitstellung von durchsuchbaren Volltexten. Liegen die Volltexte im Format <span class="tooltip">ALTO<span class="tooltiptext">Analyzed Layout and Text Object</span></span> vor, so unterst&uuml;tzt der DFG-Viewer die Volltextsuche via <span class="tooltip">SRU<span class="tooltiptext">Search and Retrieval via URL</span></span>.</p></li>
<li><p><a href="http://iiif.io/" target="_blank"><span class="tooltip">IIIF<span class="tooltiptext">International Image Interoperability Framework</span></span></a> ist ein relativ neuer Standard f&uuml;r die Bereitstellung von <a href="http://iiif.io/api/image/2.1/" target="_blank">Images</a>, <a href="http://iiif.io/api/search/1.0/" target="_blank">Volltexten</a> und <a href="http://iiif.io/api/presentation/2.1/" target="_blank">Annotationen</a>.</p></li>
</ul>
</div>
<div class="content" id="w4_4d" style="display: none;">
<p>Digitalisate m&uuml;ssen, um von anderen Objekten oder Datenbanken aus erreichbar zu sein, eindeutig angesprochen werden k&ouml;nnen. Dazu ist &uuml;ber die &uuml;bliche Zitierform hinaus, die durch ein Angebot in der Navigationssoftware als klassische Form weitergenutzt werden kann und sollte, die Festlegung und die online zug&auml;ngliche Dokumentation von Adressierungstechniken erforderlich. Sichergestellt werden m&uuml;ssen die Erreichbarkeit und Zitierbarkeit einer Ressource als Ganzes und die Erreichbarkeit und Zitierbarkeit von einzelnen physischen Seiten dieses Werkes.</p>
<p>Die <a href="http://www.dfg.de/formulare/12_151/" target="_blank">DFG-Praxisregeln "Digitalisierung"</a> fordern die Sicherstellung einer persistenten Adressierbarkeit der online bereitgestellten Ressourcen mit einer "gr&ouml;&szlig;tm&ouml;gliche[n] Granularit&auml;t". Hierbei k&ouml;nnen verschiedene Persistenz-Verfahren genutzt werden (<span class="tooltip">PURL<span class="tooltiptext">Persistent Uniform Resource Locator</span></span>, <span class="tooltip">URN<span class="tooltiptext">Uniform Resource Name</span></span>, <span class="tooltip">DOI<span class="tooltiptext">Digital Object Identifier</span></span>, Handle etc.). Die Nutzung von <span class="tooltip">URN<span class="tooltiptext">Uniform Resource Name</span></span>s wird jedoch von den Praxisregeln "nachdr&uuml;cklich empfohlen".</p>
<p>Das 2009 von der Deutschen Nationalbibliothek und der ULB Halle erarbeitete Verfahren <strong>URN granular</strong> bedient sich einer Adressierungstechnik, die auf die granulare Adressierung monographischer Werke unter Ma&szlig;gabe der oben zitierten Anforderungen der DFG-Praxisregeln abzielt. Die Nutzung dieses Verfahrens bei der Adressierung komplexerer Objekte ist jedoch nur eingeschr&auml;nkt m&ouml;glich. Basierend auf einem Konzept, das in der generellen RFC-Spezifikation zu URIs als "fragment identifier component of a URI" bezeichnet wird, wurde daher <strong>URN granular 2</strong> entwickelt, um den komplexeren Herausforderungen bei der Bereitstellung und Adressierung von digitalisierten Zeitungen Rechnung zu tragen.</p>
<p>Eine andere Methode sind <strong><span class="tooltip">DOI<span class="tooltiptext">Digital Object Identifier</span></span></strong>s, die eindeutige und dauerhafte Identifikatoren f&uuml;r digitale Ressourcen bereitstellen und in der Praxis vor allem f&uuml;r die Referenzierung von Artikeln wissenschaftlicher Fachzeitschriften verwendet werden. Das <span class="tooltip">DOI<span class="tooltiptext">Digital Object Identifier</span></span>-System kennt granulare Adressierungstechniken f&uuml;r den Zugriff auf Teile von digitalen Ressourcen, wie sie f&uuml;r das Verfahren URN granular 2 beschrieben wurden. Weitere Details hierzu finden Sie auch im <a href="http://www.zeitschriftendatenbank.de/fileadmin/user_upload/ZDB/z/Masterplan.pdf#page=38&zoom=auto,69,450" target="_blank">Masterplan</a> auf S. 37 ff.</p>
</div>
</div>
</div>
<div class="container" id="w5" style="display: none;">
<div class="left_column">
<button id="5a" onclick="toggle_content('w5_5a');">Langzeit- archivierung</button>
</div>
<div class="right_column">
<div class="content" id="w5_5a" style="display: none;">
<p>Die Langzeitarchivierung der in einem Projekt entstehenden Digitalisate ist eine der grundlegenden Bedingungen, die f&uuml;r eine F&ouml;rderf&auml;higkeit gestellt werden. Damit ist nicht nur die Sicherung der entstehenden Dateien vor Kompromittierung oder Verlust gemeint, sondern auch ihre stabile Adressierung und Zitierbarkeit im Netz, zuverl&auml;ssige Zugangssysteme und komfortable Nachnutzungsm&ouml;glichkeiten. Hinzu kommt die langfristige Sicherung der Nutzbarkeit der Dateien in zuk&uuml;nftigen Systemumgebungen, die andere Dateiformate als die heute verbreiteten voraussetzen: Es m&uuml;ssen rechtzeitig Migrationen in andere Formate vorgenommen werden, die &uuml;ber die erforderlichen Features f&uuml;r die Nutzung der Dateien verf&uuml;gen. Auch andere Formen der langfristigen Absicherung der Nutzbarkeit der Daten sind denkbar.</p>
<p>In der Regel wird eine digitalisierende Einrichtung diese Aufgabe nicht selbst &uuml;bernehmen, sondern an einen geeigneten Dienstleister &uuml;bergeben. Dabei ist es wichtig, in der vertraglichen Vereinbarung mit diesem die Anforderungen an die Qualit&auml;t der Langzeitarchivierung zu vereinbaren und Sicherheit dar&uuml;ber zu erlangen, welche wechselseitigen Leistungen erwartet werden. Es empfiehlt sich, eine solche Vereinbarung bereits im Vorfeld eines Digitalisierungsprojekts abzuschlie&szlig;en, um sich daraus ergebende Vorbedingungen insbesondere f&uuml;r die Aufbereitung der im Projekt entstehenden Daten bereits fr&uuml;hzeitig festlegen zu k&ouml;nnen.</p>
<p>In Deutschland hat sich zur Beratung und wechselseitigen Unterst&uuml;tzung das <a href="http://www.langzeitarchivierung.de/" target="_blank">nestor-Netzwerk</a> etabliert, in dem auch alle wesentlichen Anbieter von Dienstleistungen auf dem Gebiet der Langzeitverf&uuml;gbarkeit vertreten sind. Ein wichtiger Indikator f&uuml;r die Vertrauensw&uuml;rdigkeit eines Archivservices ist daher auch die Zertifizierung des jeweiligen Archivs, die mit dem "<a href="http://www.langzeitarchivierung.de/Subsites/nestor/DE/Siegel/siegel_node.html" target="_blank">nestor-Siegel</a>" dokumentiert wird.</p>
</div>
</div>
</div>
<div class="footer">
<br><hr> Gef&ouml;rdert durch die&nbsp;<a href="http://www.dfg.de/" target="_blank"><img src="data:image/gif;base64,R0lGODlh+gAfAMQAAIiu0n+ozu7z+d3o8szc7EB9thFdpDN0sWaXxSJoq3eiy1WLvqrF35m52J+92u/0+b/T5xBcpGCTw1CIvM/e7d/p8zBysHCdya/I4Y+z1CBnqrvR5UR/uABRnv///wAAACH5BAAAAAAALAAAAAD6AB8AAAX/IBSMZGmWUOWtbHu+8Oi09Po4UtHtPF9MAcijRiwaj8ikcslsOp/GQG9KpVoyw1p1uy0YIRPuNsAkbM4DqFPRULvfcLdUTO9EZrQ63Vuj6PRTZEscCRwcHQcEThwATIxxkJGSNHOAXBJ5llV8LQ6agY6NHgIAHYqhqJOqq1CVn1QZLa9TnCsSszyCSo8sABwrCgYdCAIebCsEvw0Ghb8MCR0GCCsAwgcbHAoIHQmnxsLErOLirrg8KivmO7UZ6h26SbwrAx0DCgsCAhzTvBsdHgMOIEDTgQHABcYOpGngK8EGDwsOAMOnb9q4i5LKqcOUTh0nCO7epWLRwV8aDwwM/3jo92+lKH/FVggo2IJlupMpMercuaKCRipZxNRKYqFOBAkYsqyg4CAMPCTy0vkzxOHAP5suZTJTYNAfDZtTDVnlSRajJzF4hDLBUGeCUiIPKIz0QKBgyTNnsnrwqneUL0R8WYC9i7esYXF/tnBUuySMGI6Soi5AQO+k4JctoyLr0MBUTcwA6x0eLa4dFz6MlexZ1S9iMQ4IR7VBEHvbisnIHo6qB3seA6y9ZZMeHgekmI5dlhjnIlfVoR0JAMQMWEgaXQMHBLbcYIAQAWYcDDSifqgBVvLWiav34KCA+/fw4dJBXiUC/PvvL3hgy8XCYTMxjbJBgDJtcIoZltE1IP8SAK633k88FDGfB+54AeEO+jmo4YarXNiSFsdR6JEHHj7F4YkoOuGhhCFWSKIYJtI3RYo0nrgiERO6eNYYLFZR448O3khDBTmOuFwVGYLooxJm4LVgHMcAeQQBCa7RhhK+cOCNkC0cSUUEMr7ixQNi+IfjFoM0Y4g3b2gm5VeiQOEmEQAkwMBvonDJwgWMpZaEBmKgk8mS8cQZmaFvTjJnDbzwoqcHD0QgRoZ+IsEnFxOcSShUiAqwzTAxsfEbAc9EY1E1gGWzTTfAXJkMMACs6o0C0SzwC0rQpEerAbayEAyoxvzFgQC0sgoMOMUco0Cs3JxSanqoXqNqs8dGo4D/B8tUBx4Hej5QlBgQhNnDUEcQiZaSVAwyUGEIHJAPbit1BwA9Bg2AkAIKYdvQQxGtAJxDEEmU0ACk/EPvQQMXPFE++8T7UHiNACDwPQzz0wgh/Ep0sL0D64txwNQoMoABDQQ0EAECnVEiCRdIKoYGJJ3WxC1iTNAcpFykSdWwntHVwWvX7vUzCzMZdNkKfAEH2kyneAUT0T3zJRpKKvHiC9ItTZ3TI4MFWPRnWLcgwAYHXCyKoyHxgIeIyTFRgcvuDGJoYBQ+LIoAW3X1ob+g6ZU0aIF5hXcCXAnNgtMdUDWW1bcirvhVZoc9eOF0+70dNAeIpxfaaZsprg9O8Bf3/y5z711SX6Qccs3elvMdduuBt5Q6YB8i7qTd1DT+jz+3Z4XV7KvDKbkBQXN9dp5pR3Az25s8saM5crdQ2TyiuVlXZ2wq/bpN0xvewvVTe9X90R5cbfj4rmPFAvjZA/6h8a6/6I7ygzbvPNyzRF+TRQjcyosZMuFNbAaAp9fRZgW2ad1KpmGvfwBwNwNoWAP9FRsBtIFx26vgBSNnuAfOJIIDLOD5RPMdDsLLQ3pwC7qoQK4lVCAxr9Df+hKQHWP9DzyaIw9nsPKd7CSQh4cgnANx2IhkcINW8zhAdSyWu9ehh4k2+U51xqPE8mAFAd3JDge5QwgUcuEoy5OFzNwAhmNXeE4NeTECgr73pCKMjUBJYIDAFFQllMxRQXBkUBv1mKAGqZFNNBgbAUQQAxg4IIw1KOTa3HADCXzrSwWQQBDekigaAEABG5AjonqBSU1W8pOg5MkG+reAKxFhlLAxZShrEAIAOw==" alt="dfg_logo"></a>
</div>
</div>
<script type="text/javascript">function toggle_container(e){var n=document.getElementById(e),t=document.getElementsByClassName("container"),l=document.getElementsByClassName("content");document.getElementById("intro").style.display="none",[].forEach.call(t,function(e){e!==n?e.style.display="none":n.style.display="none"===n.style.display?"block":"none"}),[].forEach.call(l,function(e){e.style.display="none"})}function toggle_content(e){var n=document.getElementById(e),t=document.getElementsByClassName("content");[].forEach.call(t,function(e){e!==n?e.style.display="none":n.style.display="none"===n.style.display?"block":"none"})}</script>
</body>
</html>
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment