ESS Berichterstattungsstandards für Referenz-Metadaten

In dieser allgemeinen Einführung werden die Standards erläutert, die im Europäischen Statistischen System (ESS) zur Beschreibung von Inhalt und Qualität der auf der Eurostat-Website verbreiteten Daten herangezogen werden. Diese spezifische Art von Informationen wird Referenz-Metadaten genannt.

In den folgenden Abschnitten werden die Unterschiede zwischen Struktur- und Referenz-Metadaten erläutert und die verschiedenen Berichterstattungsstrukturen für Metadaten innerhalb des ESS beschrieben. Anschließend wird die von Eurostat entwickelte IT-Plattform zur Speicherung und Verbreitung von ESS-Metadaten vorgestellt.

Strukturelle Metadaten versus Referenz-Metadaten

Man kann zwischen zwei Arten von statistischen Metadaten unterscheiden, nämlich zwischen den strukturellen Metadaten und den Referenz-Metadaten.

Strukturelle Metadaten dienen der Identifizierung statistischer Daten (Titel, Untertitel, Kurzbeschreibungen, Dimensions- und Variablenbezeichnungen, Dimensionen usw.).

Zu den strukturellen Metadaten gehören beispielsweise die Titel der Variablen und Dimensionen statistischer Datensätze sowie die jeweiligen Maßeinheiten (z. B. EUR), ferner u. a. Listen mit Codes (etwa zur Klassifizierung von Gebieten), Datenformate, potenzielle Bandbreiten von Werten, zeitliche Dimensionen, Bandbreiten von Markierungen und verwendete Klassifikationen.

Daten und strukturelle Metadaten gehören unbedingt zusammen. Die Zahl 3 651 881 hat ohne die dazugehörigen strukturellen Metadaten keinerlei Bedeutung und es lässt sich nicht erkennen, dass sie für die weibliche Bevölkerung Bulgariens zum 1. Januar 2017 steht.

Referenz-Metadaten geben über die statistischen Konzepte und die Methoden für die Sammlung und Generierung von Daten sowie über die Datenqualität Aufschluss.

Sie bieten den Datennutzern Hilfestellung bei der Auslegung der Daten und sind somit stark auf den Inhalt ausgerichtet.

Die Referenz-Metadaten lassen sich im Gegensatz zu den strukturellen Metadaten von den Daten abkoppeln und können somit getrennt von den ihnen zugrunde liegenden Statistiken generiert, gesammelt oder verbreitet werden.

Sie können auch mit unterschiedlichen Datenebenen (ganze Sammlungen, Datensätze aus einem bestimmten Land bzw. für ein Land oder Jahr stehendes Datenelement) verknüpft werden.

Illustration

Meldestandards für die wichtigsten Referenz-Metadaten

Im ESS werden vor allem die folgenden Meldestandards für die wichtigsten Referenz-Metadaten verwendet:

Einheitliche Integrierte Metadatenstruktur (SIMS)

SIMS gibt als dynamisches Verzeichnis den konzeptionellen Rahmen für alle Qualitäts- und Referenz-Metadaten-Konzepte des ESS vor.

Alle statistischen Konzepte der beiden bisherigen ESS-Meldestrukturen (ESMS und ESQRS – siehe unten) wurden in diese Struktur eingebunden und gestrafft. Zu diesem Zweck wurde dafür gesorgt, dass alle Konzepte vertreten sind und daher nur einmal gemeldet werden (direkte Wiederverwendbarkeit bestehender Informationen).

Es handelt sich insofern um eine dynamische Struktur als zusätzliche statistische Metadaten und Qualitätskonzepte bei Bedarf künftig eingebunden werden können.

Das PDF icon erste SIMS-Handbuch wurde 2014 veröffentlicht und 2016 in einer PDF icon überarbeiteten Fassung vorgelegt.

Qualität hat in der Welt der Statistik höchsten Stellenwert. Mit der Einführung der SIMS wird ein Beitrag zur Meldequalität im Bereich der europäischen Statistiken geleistet.

Die Produzenten amtlicher Statistiken müssen gewährleisten, dass europäische Statistiken nach einheitlichen Standards und harmonisierten Methoden entwickelt, erstellt und verbreitet werden.

Überdies wird den Statistiknutzern der Zugang zu adäquaten Metadaten garantiert, mit denen die statistischen Ergebnisse so beschrieben werden, dass die Statistiken von den Nutzern korrekt ausgelegt und verwendet werden können.

Euro-SDMX-Metadaten-Struktur (ESMS)

Diese standardisierten, nutzerorientierten ESMS-Dateien dienen zur Beschreibung statistischer Datensätze, die Eurostat auf der eigenen Website veröffentlicht.

Mit den ESMS-Dateien sollen Methoden, Qualitätsaspekte und die Prozesse der Produktion von Statistiken generell dokumentiert werden.

ESMS-Dateien beruhen, wie aus der Bezeichnung hervorgeht, auf SDMX-Standards. Die 19 statistischen Konzepte der oberen Ebene leiten sich von den bereichsübergreifenden SDMX-Konzepten ab, die im Word icon SDMX-Glossar veröffentlicht sind.

Mithilfe des ESMS-Standards werden zunehmend auch Dateien mit nationalen Referenz-Metadaten an Eurostat übermittelt.

Nachstehend ein Beispiel für standardisierte Referenz-Metadaten, die sowohl Eurostat-Metadaten als auch nationale Referenz-Metadaten umfassen.

Euro-SDMX-Metadatenstruktur – Indikatorenprofil (ESMS-IP)

Durch das Excel icon ESMS-IP werden standardisierte Referenz-Metadaten für Indikatoren bereitgestellt.

Grundlage des ESMS-IP ist die Euro-SDMX-Metadatenstruktur (ESMS). Außerdem enthält es in einem kurzen PDF iconQualitätsfeld“ ganz oben eine zusammenfassende Bewertung der wichtigsten Qualitätsmerkmale eines Indikators.

Das ESMS-IP bietet Hilfestellung bei der Nutzung und Analyse des Indikators und unterstützt die Verfahren zur Auswahl neuer Indikatorsätze. Nachstehend einige Beispiele für die Anwendung des ESMS-IP-Standards:

Die ESMS-IP werden zur Dokumentation der Qualität der Europa-2020-Indikatoren und der Indikatoren für die Ziele für nachhaltige Entwicklung (SDG). [Nach Öffnen einer Seite für einen bestimmten Indikator (z. B. „keine Armut“) werden durch Anklicken des Icons metadata icon die ESMS-IPs auf der Seite ganz unten angezeigt.

Standardaufbau für ESS-Qualitätsberichte (ESQRS)

Mit dem Standard ESQRS werden Qualitätsberichte innerhalb des ESS erstellt und verbreitet.

Den ESQRS-Dateien können ausführliche Informationen über die Qualität der von Eurostat veröffentlichten Datensätze entnommen werden.

Die weit gefassten Konzepte sind mit den im SDMX-Glossar (2016) veröffentlichten bereichsübergreifenden SDMX-Konzepten kompatibel.

Diese Metadaten-Struktur wird zunehmend auch für nationale Qualitätsberichte herangezogen.

Zugang zu SIMS-basierten Metadaten und Qualitätsberichten

SIMS sovie ihre zugrundeliegende Meldestrukturen ESMS und ESQRS sind in der Eurostat-Datenbank zu finden. Sie sind einzelnen Datensätzen oder häufiger (auf Ähnlichkeiten der veröffentlichten Daten beruhenden) Sammlungen von Datensätzen als Anhänge beigefügt. Diese Dateien werden mit dem Icon metadata icon gekennzeichnet.

Die nachstehende Abbildung enthält Beispiele für Dateien mit Referenz-Metadaten, die in Eurobase, der Eurostat-Datenbank für die Verbreitung statistischer Datensätze, Datensätzen oder Sammlungen von Datensätzen beigefügt sind.

Example of reference metadata files in the data navigation tree

Metadata Handler des Europäischen Statistischen Systems
   (ESS MH)

Die Webanwendung ESS MH wurde von Eurostat zur Unterstützung von Produktion, Verwaltung, Austausch und Verbreitung von Dateien mit nationalen und europäischen Referenz-Metadaten, die auf den genannten Standards basieren, genutzt.

Die nachstehende Abbildung veranschaulicht das generelle Verfahren zur Meldung SDMX-kompatibler Referenz-Metadaten sowie die Verwendung des ESS MH.

Diagram

(Edamis ist bei Eurostat die zentrale Dateneingangsstelle für alle Daten und Metadaten)

Nähere Informationen zu dieser Anwendung siehe ESS-MH-Webseite.

Weitere Informationen

  • Webseite „Qualitätsberichte: Handbücher zum Thema Qualität europäischer Statistiken
  • SDMX InfoSpace: Wissenswertes über das Verfahren für den Austausch statistischer Daten und Metadaten (Statistical Data and Metadata eXchange (SDMX)) im Europäischen Statistischen System