EDV-Tage Theuern

 
Druckversion in Extra-Fenster öffnen

Zur Navigationsliste | Zur Designversion

 

Es ist allgemein bekannt, dass die amerikanische Raumfahrtbehörde NASA vor einigen Jahren feststellen musste, dass ihre während der ersten Mondlandung 1969 gewonnenen wissenschaftlichen Daten zu einem beachtlichen Teil nicht mehr lesbar waren.

Karl-Ernst Lupprian: Open Archival Information System

Es ist allgemein bekannt, dass die amerikanische Raumfahrtbehörde NASA vor einigen Jahren feststellen musste, dass ihre während der ersten Mondlandung 1969 gewonnenen wissenschaftlichen Daten zu einem beachtlichen Teil nicht mehr lesbar waren. Wenn man bedenkt, dass die Auswertung derartiger Datenmengen leicht mehrere Jahrzehnte dauern kann, und wenn man ferner bedenkt, dass selbst über hundert Jahre alte Datensammlungen, die unter neuen Gesichtspunkten ausgewertet werden, überraschend neue Erkenntnisse liefern können, dann begreift man, welche Bedeutung der langfristigen sicheren Aufbewahrung wichtiger Daten bei gleichzeitiger Wahrung ihrer Lesbarkeit zukommt. Dies gilt schon für Daten auf klassischen Trägermaterialien - sei es Papier oder Film - und in ganz besonderem Maß für digitale Daten, die sich auf Grund ihrer Eigenschaften und in Anbetracht ihrer oft ungeheuren Mengen gar nicht anders speichern und nutzen lassen. Die brennende Frage ist nun, wie man das machen kann.
Ich glaube, das niemand mehr ernsthaft die Meinung vertreten wird, dies ginge ihn nichts an. Jede Einrichtung, die hier in Theuern vertreten ist, verfügt wohl bereits jetzt über digitale Daten, deren längerfristige Aufbewahrung und Nutzung sichergestellt sein sollten. So können gedruckte Museumsinventare, Bibliothekskataloge oder Archivfindbücher die Datenbanken, aus denen sie erstellt wurden, nur unvollkommen ersetzen. Multimediale Publikationen lassen sich ausschließlich in digitaler Form nutzen. Doch wer wird Sorge tragen, dass diese Produkte, die mit großem Zeit- und Kostenaufwand hergestellt wurden, in zwanzig oder fünfzig Jahren noch benützt werden können? Wer wird in fünfzig Jahren noch nachsehen können, wie die eigene Homepage im Jahr 2000 ausgesehen hat? Wer garantiert uns, dass die Entwicklung der Besitzverhältnisse an Grund und Boden, die bereits jetzt zum größeren Teil nur digital dokumentiert werden, im Jahr 2050 noch beweiskräftig nachvollziehbar sein wird?
Die Probleme der langfristigen oder gar der unbefristeten Aufbewahrung digitaler Daten und ihrer ständigen Nutzbarmachung sind so schwerwiegend, dass sie nur in internationaler Kooperation gelöst werden können. Wer glaubt, diese immense Arbeit allein leisten zu können, wird über kurz oder lang vor den Kosten kapitulieren. Es ist aber nicht damit getan, dass auf nationaler, europäischer und internationaler Ebene ein Forschungsprojekt nach dem anderen aufgelegt wird. Allein im Archivbereich ist es für den Einzelnen nahezu unmöglich, nur die laufenden Projekte im Auge zu behalten.
Was wir brauchen, das sind Standards und Modelle. Diese müssen zum einen hinreichend abstrakt sein, damit sie nach Möglichkeit überall herangezogen werden können, zum anderen aber auch differenziert genug, um für den jeweiligen Einzelfall konkrete Praxislösungen aus ihnen ableiten zu können - egal, ob es sich um Daten der Weltraumforschung, digitale Grundbücher, Kartenmaterial, wissenschaftliche Publikationen oder Akten der Verwaltung handelt.
Nicht von ungefähr war es die NASA, die die Entwicklung eines Modells für ein digitales Archiv angestoßen hat, das zu einem internationalen Standard führen soll. Unter Beteiligung bedeutender Forschungseinrichtungen wie der europäischen ESA und nationalen Weltraumforschungszentren in Großbritannien, Kanada, Frankreich, Deutschland, Brasilien, Japan und Russland legte das amerikanische Beratungskomitee für Weltraumdatensysteme (CCSDS) im Mai 1999 einen Entwurf für ein 'Referenzmodells für ein Offenes Archivisches Informationssystem (OAIS)' vor, der im Internet abgerufen werden kann. (1)
Es ist auch kein Zufall, dass die Bearbeiter des Referenzmodells sich ganz besonders die Erfahrungen der Archive zu Nutze gemacht haben. Archive sind auf die langfristige bzw. unbefristete Aufbewahrung und Nutzung von Unterlagen spezialisiert. Die grundlegenden Erkenntnisse der Archivwissenschaft und eine gut hundertjährige Erfahrung lassen sich auch auf die digitale Information anwenden. Im Folgenden möchte ich zeigen,
1. was unter einem OAIS zu verstehen ist,
2. was das Referenzmodell zu bieten hat,
3. welche Eigenschaften es hat und
4. wie es aufgebaut ist.

 1. Was ist ein Offenes Archivisches Informationssystem?

Ein OAIS ist ein Archiv, das
  • e ine Organisation von Menschen und Systemen ist und das verantwortlich ist
  • für die Aufbewahrung von Informationen
  • über lange Zeiträume und
  • die Verfügbarmachung dieser Informationen für eine bestimmte Nutzergemeinschaft.
Die Definition des Entwurfs des Referenzmodells mag auf den ersten Blick banal erscheinen, entspricht sie doch der auf dem europäischen Kontinent längst üblichen Definition eines Archivs. Für die englischsprachige Welt ist sie jedoch notwendig, da das Englische mit dem Wort archive(s) sowohl die Registratur (also die schriftgutverwaltende Einrichtung) als auch das Archiv im engeren Sinne (also die Einrichtung, die aus dem Schriftgut eine für die langfristige bzw. unbefristete Aufbewahrung geeignete Teilmenge aussondert und übernimmt).
Die Definition betont, dass ein Archiv eine Organisation von Menschen und Systemen ist und zieht damit eine Trennlinie zu rein technischen und kurzlebigen Lösungen, wie sie von der IT-Branche unter dem Schlagwort 'elektronische Archivierung' angeboten werden.
Verantwortlich impliziert, dass ein OAIS strikten gesetzlichen, statutarischen und anderen rechtsverbindlichen Regelungen unterworfen ist. Hierzu gehört auch, dass seine Informationen einer bestimmten Nutzergemeinschaft zur Verfügung stehen. Damit wird den Besonderheiten des Archivguts im Gegensatz zu Bibliotheks- und Museumsgut Rechnung getragen.
Der Begriff 'offen' bedeutet, dass die Entwicklung des OAIS sich in offenen Foren abspielt, meint nicht jedoch den uneingeschränkten Zugang zu einem Archiv.

 2. Was bietet das ISO-Referenzmodell eines OAIS?

Das ISO-Referenzmodell eines OAIS bietet:
  • einen Rahmen für ein besseres Verständnis archivischer Konzepte für die langfristige Erhaltung und Nutzbarmachung digitaler Informationen,
  • Konzepte für nichtarchivische Einrichtungen, um am Erhaltungsprozess sinnvoll teilnehmen zu können,,
  • einen Rahmen (mit Fachbegriffen und Konzepten) zur Beschreibung und zum Vergleich des Aufbaus und der Arbeitsweise jetzt und künftig vorhandener Archive,.,
  • eine Grundlage für den Vergleich der Datenmodelle digitaler Informationen, die von Archiven aufbewahrt werden, und für die Diskussion, wie Datenmodelle und die Informationen selbst sich im Lauf der Zeit verändern können,,
  • eine Grundlage, die erweitert werden kann, um die langfristige Erhaltung von nicht-digitalen Informationen einzubeziehen,,
  • einen breiteren Konsens über Elemente und Verfahren zur langfristigen Erhaltung und Nutzung digitaler Informationen und damit einen breiteren Markt für Anbieter,,
  • Anregungen für die Entwicklung von auf das OAIS bezogenen weiteren Standards.,

 3. Die Eigenschaften des OAIS-Referenzmodells

Das ISO-Referenzmodell eines OAIS
  • ist strikt logisch strukturiert und damit unabhängig von jeder Implementation,
  • lässt sich mit der Sprache UML (Unified Modeling Language) grafisch darstellen, und zwar von der Ebene einfachster Übersichten bis zum komplexen Detailplan,
  • kann sowohl aus der Sicht der Funktionalität als auch des Informationsflusses dargestellt werden,
  • betrachtet den Informationsfluss als Abfolge von aufgabenorientierten Datenpaketen,
  • ist primär für die Verarbeitung digitaler Informationen gedacht, kann jedoch auch auf nichtdigitale Informationen angewendet werden und erlaubt damit die Verarbeitung hybrider Unterlagen.

 4. Der Aufbau eines OAIS 2 (2)

Abbildung 1 zeigt das OAIS in seiner 'Umwelt'.
Die Erzeuger (Producer) von Informationen liefern diese an das Archiv, das wiederum stellt die Informationen den Benützern (Consumer) zur Verfügung. Die Beziehungen des Archivs zu Informationslieferanten und Informationsnutzern werden durch ein Regelwerk gesteuert, das vom Archivträger festgelegt und dessen Einhaltung von ihm kontrolliert wird (Management).

Abbildung 2 zeigt die Erzeugung von Informationen aus Daten, denn Daten sind noch keine Informationen.
So ist z. B. eine Tabelle mit Zahlen, aber ohne Angaben, was diese Zahlen bedeuten, unverständlich und wertlos. Erst die Beschriftung der Spalten und Reihen der Tabelle erlaubt eine Interpretation der Daten. 'Representation Information' ist also schlicht die Erläuterung, welcher Art die Daten sind. Erst damit werden Daten zu Informationen.

Abb. 3: Informationen können nicht als beliebig lange
Datenströme übernommen und nutzbar gemacht werden. Man muss sie in handhabbare Pakete aufteilen. Ein solches Paket enthält zum einen den Informationsinhalt (Content Information) - das sind die eigentlichen nutzbaren Daten - und zum anderen Informationen, die für die Erhaltung des Informationsinhalts notwendig sind (z. B. Kodierungsinformationen, unter welchem Betriebssystem und mit welcher Software wurden die Informationen erstellt, usw.; Preservation Description Information). Diese beiden Informationsblöcke werden in einer Hülle (Packaging Information) zusammengefasst.
Um mit dem Paket umgehen zu können, muss auch eine Beschreibung des Pakets selbst (Descriptive Information about Package 1) vorhanden sein (von wem kommt es, welche Beziehungen gibt es zu anderen Paketen, wie ist das Paket technisch aufgebaut usw.).


Abb. 4: Ein OAIS besteht aus fünf Funktionsbereichen:
  • Übernahme (Ingest): Aussonderungspakete (Submission Information Packages, SIP) werden übernommen und auf Vollständigkeit und Unversehrtheit überprüft. Dann wird aus dem SIP ein Archiv-Informationspaket (Archival Information Package, AIP) erzeugt, das den archivinternen Regeln (z. B. für Datenformat, Datendokumentation) entspricht. Aus dem AIP werden beschreibende Informationen (Descriptive Info) für die Findmitteldatenbank des Archivs extrahiert. Das AIP wird nun in den Archivspeicher (Archival Storage) eingestellt, dies wird der Datenverwaltung (Data Management) mitgeteilt.
  • Archivspeicher (Archival Storage): Der Archivspeicher sorgt für die Aufbewahrung und Erhaltung der AIP. Er sorgt für Backups, prüft regelmäßig die Integrität der Daten, stellt Wiederherstellungsmechanismen für Notfälle sowie die AIP für die Nutzung zur Verfügung.
  • Datenverwaltung (Data Management): verwaltet die beschreibenden Informationen, die Archivbestände und Dokumente identifizieren, sowie weitere Daten, die für den Umgang mit dem Archivgut notwendig sind. Dazu gehört die Verwaltung der Datenbank. Ferner werden Anfragen (queries) aus dem Nutzungsbereich entgegengenommen und bearbeitet.
  • Verwaltung (Administration): Steuerung der Gesamtabläufe im OAIS und seiner Außenbeziehungen. Dazu gehört u.a. die Konfiguration von Hard- und Software.
  • Nutzung (Access): Unterstützt die Benützung: Annahme von Anfragen (queries), Überprüfung von Zugriffsrechten, Erzeugung von Auskunftspaketen (Dissemination Information Packages, DIPs) und deren Übergabe an die Benützer.
Nicht abgebildet, weil systemumspannend und abhängig von der jeweiligen Implementation, ist ein sechster Funktionsbereich namens 'Allgemeine Dienste' (Common Services). Er bietet
  • Betriebssystemdienste,
  • Netzwerksdienste
  • Sicherheit
Dieses Modell wurde bereits in praktische Lösungen umgesetzt. So wird es von der National Archives Records Adminstration (NARA) in Washington für die Archivierung digitaler Unterlagen eingesetzt. Das niederländische Reichsarchiv hat ein Projekt 'Digitales Archiv 2000' begonnen, das sich auf das Referenzmodell stützt, und auch das jüngst von der Deutschen Forschungsgemeinschaft genehmigte Projekt 'Archivierung digitaler Unterlagen' der Staatlichen Archive in Bayern wird versuchen sich dieses Modell nutzbar zu machen.
Kein Modell und kein Standard sind perfekt. Es ist nicht besonders schwierig Lücken und Mängel zu finden und daran herumzunörgeln. Aber wäre es nicht besser, sich an solche Modelle und Standards zu halten, eine starke Gemeinschaft von Anwendern zu bilden und dadurch zu praktikablen Lösungen zu gelangen anstatt auf die perfekte Lösung zu warten, die es nie geben wird? Im Bereich der Bibliotheken hat man das wohl zuerst begriffen, wobei die weitgehende Standardisierung bibliografischer Titelaufnahmen die Aufgabe erheblich erleichtert hat. Im Archivbereich - und nur für ihn kann ich sprechen - gibt es erst Ansätze und noch zu wenig Konsens. Oft wird hier vorgebracht, dass die im angelsächsischen Bereich entwickelten Modelle und Standards nicht mit den kontinentaleuropäischen Traditionen 'kompatibel' seien. Selbst wenn dem so sein sollte, bedarf es doch einer intensiven Diskussion der Vor- und Nachteile und.der Möglichkeiten, eigene Gegebenheiten mit dem Standard vereinbar zu machen oder aber - was manchem schwerfällt - die eigenen Gegebenheiten zu überdenken und gegebenenfalls zu Gunsten des Standards zu modifizieren oder im Extremfall aufzugeben. Örtliche, regionale und nationale Eigenbröteleien sind im Zeitalter der Globalisierung fehl am Platz. Wer daran festklebt, bezahlt dies bald mit dem Absinken in Bedeutungslosigkeit.

 Anmerkungen

(1) Consultative Committee for Space Data Systems (Hg.), Draft recommendation for space data system standards: reference model for an Open ARchival Information Systems (OAIS), CCSDS 650.0-R-1 Red Book, Mai 1999. URL: http://www.ccsds.org/.

(2) Sämtliche Abbildugen wurden dem in Anm. 1 zitierten Werk entnommen. Es entsprechen: Abb. 1: Figure 2-1, Abb. 2: Figure 2-2, Abb. 3: Figure 2-3 und Abb. 4: Figure 4-1.

 Zur Person

|

Diesen Beitrag haben 1.950 Besucher der Tagungs-Webseite angeschaut, zuletzt Montag, 30. Aug  10 um 07:07 Uhr

Letzte Ergänzung der Webseite: 06.09.10

Dies ist die Textversion.
Sie benutzen CCBot/1.0 (+http://www.commoncrawl.org/bot.html)

Webmaster: RexPublica