Datenzugang
&p>
Arbeitsplätze für Gastwissenschaftler |
Kontrollierte Datenfernverarbeitung |
Scientific-Use-Files |
Public-Use-Files |
CAMPUS-Files |
Kombination der Zugangswege
Über die Forschungsdatenzentren bieten die Statistischen Ämter des Bundes und der Länder vier verschiedene Formen des Zugangs zu ausgesuchten Datenbeständen der amtlichen Statistik an.
On-Site-Nutzung:
- Arbeitsplätze für Gastwissenschaftler
- Kontrollierte Datenfernverarbeitung
Off-Site-Nutzung:
- Scientific-Use-Files
- Public-Use-Files
- CAMPUS-Files
Die Zugangswege unterscheiden sich sowohl hinsichtlich der Anonymität der nutzbaren Daten als auch in der Art der Datenbereitstellung. Gemäß den Vorgaben des Bundesstatistikgesetzes (BStatG) bestehen weitere Unterschiede im Personenkreis, dem die Daten zugänglich gemacht werden dürfen.
Die im Datenangebot aufgeführten Erhebungen können bei den Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder auf Antrag genutzt werden. Anträge können für inhaltlich und zeitlich eingegrenzte wissenschaftliche Projekte gestellt werden. Die Projektlaufzeit ist auf einen Zeitraum von drei Jahren beschränkt. Für die Nutzung der Daten über die Forschungsdatenzentren wird ein Entgelt erhoben.
Die einzelnen Zugangswege sowie die damit verbundenen Entgelte werden im Folgenden näher erläutert.
ON-Site-Nutzung:
Arbeitsplätze für Gastwissenschaftler
In allen Standorten der beiden Forschungsdatenzentren stehen PC-Arbeitsplätze bereit, an denen faktisch anonymisierte Einzeldaten in den geschützten Räumen der amtlichen Statistik von Gastwissenschaftlern analysiert werden können. Die faktische Anonymität wird hierbei nicht allein durch die Anonymisierung der Daten erreicht, sondern in Kombination mit einer Regulierung des Datenzugangs.
Die PC-Arbeitsplätze sind mit den gängigen Analyseprogrammen (SPSS, SAS, teilw. Stata) ausgestattet. Eine Installation zusätzlicher Software ist grundsätzlich möglich, muss jedoch im Einzelfall geprüft werden. Für E-Mail-Kommunikation und WWW-Recherche steht ein separater PC-Arbeitsplatz mit Internetanbindung zur Verfügung.
| Nutzerkreis | Bereitstellungsform | Entgelt pro Berichtsjahr | * Für die Stichprobendaten der gesetzlichen Krankenversicherung nach §268 SGB V gelten andere Konditionen. Da diese Daten nicht im Rahmen der amtlichen Statistik erhoben wurden, können Analysen hier nur auf Vollkostenbasis durchgeführt werden. |
|---|---|---|
| Hochschulen und Einrichtungen mit der Aufgabe unabhängiger wissenschaftlicher Forschung | PC in einem Statistischen Amt | 95,00 EUR* |
Die Berechnung der Entgelte erfolgt je Datenbestand, d. h. im Regelfall pro Statistik.
An den Gastwissenschaftlerarbeitsplätzen können für wirtschafts- und umweltstatistische Erhebungen auch Längsschnittdaten bereitgestellt werden. Des Weiteren besteht für eine Reihe von Erhebungen die Möglichkeit, die Erhebungen auf Ebene des einzelnen Betriebes bzw. Unternehmens zu verbinden. Ein Beispiel ist die Integration des Monatsberichts im Verarbeitenden Gewerbe mit der Produktionserhebung im Verarbeitenden Gewerbe. Die Entgelte richten sich in diesen Fällen nach der Anzahl der Statistiken und den nachgefragten Erhebungsjahren, die in den integrierten Datenfile eingegangen sind.
Für die Nutzung an einem Gastwissenschaftlerarbeitsplatz besteht in der Regel die Notwendigkeit, die für das Forschungsvorhaben benötigten Merkmale zu benennen. Sollte sich im Projektverlauf die Notwendigkeit ergeben, die Merkmalsliste zu erweitern, fällt hierfür eine Bearbeitungsgebühr in Höhe von 95 Euro an.
Kontrollierte Datenfernverarbeitung
Die Datenfernverarbeitung erlaubt als einziger Zugangsweg die Analyse formal anonymisierter Originaldaten. Für den Datennutzer besteht hier jedoch kein direkter Zugang zu den Daten.
Die Datennutzer erhalten hierzu Strukturdatensätze (Dummy-Dateien), die in Aufbau und Merkmalsausprägungen dem Originalmaterial gleichen. Mittels dieser Dummy-Dateien können Auswertungsprogramme (Syntax-Skripte) in den Analyseprogrammen SPSS, SAS oder Stata erstellt werden, mit denen die Statistischen Ämter anschließend die Originaldaten auswerten. Die Datennutzer erhalten nach einer notwendigen Geheimhaltungsprüfung schließlich die Ergebnisse dieser Auswertung.
| Nutzerkreis | Bereitstellungsform | Entgelt pro Berichtsjahr |
* Für Hochschulen und unabhängige wissenschaftliche Einrichtungen. Ansonsten je nach Aufwand. ** Für die Stichprobendaten der gesetzlichen Krankenversicherung nach §268 SGB V gelten andere Konditionen. Da diese Daten nicht im Rahmen der amtlichen Statistik erhoben wurden, können Analysen hier nur auf Vollkostenbasis durchgeführt werden. |
|---|---|---|
| Alle interessierten Personen und Einrichtungen | Übermittlung von Ergebnissen | 95,00 EUR* ** |
Die Berechnung der Entgelte erfolgt je Datenbestand, d. h. im Regelfall pro Statistik.
Im Rahmen der kontrollierten Datenfernverarbeitung können für wirtschafts- und umweltstatistische Erhebungen auch Längsschnittdaten bereitgestellt werden. Des Weiteren besteht für eine Reihe von Erhebungen die Möglichkeit, die Erhebungen auf Ebene des einzelnen Betriebes bzw. Unternehmens zu verbinden. Ein Beispiel ist die Integration des Monatsberichts im Verarbeitenden Gewerbe mit der Produktionserhebung im Verarbeitenden Gewerbe. Die Entgelte richten sich in diesen Fällen nach der Anzahl der Statistiken und den nachgefragten Erhebungsjahren, die in den integrierten Datenfile eingegangen sind.
Für die Nutzung über die Kontrollierte Datenfernverarbeitung besteht in der Regel die Notwendigkeit, die für das Forschungsvorhaben benötigten Merkmale zu benennen. Sollte sich im Projektverlauf die Notwendigkeit ergeben, die Merkmalsliste zu erweitern, fällt hierfür eine Bearbeitungsgebühr in Höhe von 95 Euro an.
OFF-Site-Nutzung:
Scientific-Use-Files (SUF)
In Form faktisch anonymisierter Mikrodaten bieten die Forschungsdatenzentren einem wissenschaftlichen Nutzerkreis die Einzelangaben gängiger Statistiken als standardisierte Scientific-Use-Files (SUF) an. Diese Daten sind so weit anonymisiert, dass sie außerhalb der geschützten Räume der amtlichen Statistik verwendet werden dürfen. Sie bieten daher im Vergleich zu den On-Site-Zugangswegen ein geringeres Analysepotenzial, sind jedoch so konzipiert, dass sie sich für einen großen Teil der wissenschaftlichen Forschungsvorhaben eignen. Der Nutzerkreis ist auf Hochschulen und Einrichtungen mit der Aufgabe unabhängiger wissenschaftlicher Forschung beschränkt.
| Nutzerkreis | Bereitstellungsform | Entgelt pro Berichtsjahr |
|---|---|---|
| Hochschulen und Einrichtungen mit der Aufgabe unabhängiger wissenschaftlicher Forschung | CD/DVD | 95,00 EUR |
Public-Use-Files (PUF)
Als absolut anonymisierte Mikrodaten stehen standardisierte Public-Use-Files (PUF) einer breiten Öffentlichkeit zur Verfügung. Aufgrund der Anonymisierung sind in Public-Use-Files nur ausgewählte Merkmale enthalten. Fachlich tief gegliederte Merkmale werden in der Regel aggregiert. Tiefere räumliche Abgrenzungen können auf der Basis von Public-Use-Files meist nicht vorgenommen werden.
| Nutzerkreis | Bereitstellungsform | Entgelt pro Berichtsjahr |
|---|---|---|
| Alle interessierten Personen und Einrichtungen | CD/DVD | verschieden |
CAMPUS-Files
Die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder haben sich zum Ziel gesetzt, den Umgang mit amtlichen Mikrodaten in der Lehre zu fördern. Sie bieten daher speziell für die Lehre CAMPUS-Files an. CAMPUS-Files sind absolut anonymisierte Mikrodaten an Hand derer Studierende die Möglichkeit haben, sich Methodenkenntnisse anzueignen sowie erste Erfahrungen mit der Auswertung von Mikrodaten zu sammeln.
| Nutzerkreis | Bereitstellungsform | Entgelt pro Berichtsjahr |
|---|---|---|
| Alle interessierten Personen und Einrichtungen | Download im Internet | unentgeltlich |
Für Studierende, die Einzelangaben der amtlichen Statistik für Seminar- und Abschlussarbeiten nutzen möchten, stehen darüber hinaus die oben genannten Nutzungswege offen. Voraussetzung ist ein Nutzungsantrag, der von dem Betreuer der Seminar- bzw. Abschlussarbeit über die Hochschule gestellt wird. Hinsichtlich der Entgelte kommen für solche Projekte Sonderkonditionen zum Tragen. Sie sehen vor, dass pro Projekt ein Entgelt in Höhe von 95 Euro anfällt.
Kombination der Datenzugangswege
Die dargestellten Wege der Datennutzung können auch miteinander kombiniert werden. So können Teile der Analyse eines Datensatzes an einem Gastwissenschaftlerarbeitsplatz erfolgen, während andere Analysen dieser Erhebung mit dem standardisierten Scientific-Use-File am Arbeitsort durchgeführt werden. Auch die Kombination von Gastwissenschaftleraufenthalt und Datenfernverarbeitung bietet sich in vielen Fällen an. Insbesondere bei längeren Forschungsprojekten sind solche Aufteilungen oft sinnvoll.
Sollte ein faktisch anonymisierter Datenbestand nicht nur am GWAP sondern auch per Datenfernverarbeitung genutzt werden, fallen die Kosten nur einmal an. Werden jedoch unterschiedlich aufbereitete Datenbestände - beispielsweise faktisch anonymisierte Daten am Gastwissenschaftlerarbeitsplatz und formal anonymisierte Daten per Datenfernverarbeitung genutzt - wird im Regelfall getrennt abgerechnet.
© Statistische Ämter des Bundes und der Länder
Letzte Änderung am 28.12.2009.
