Akquisition and Aufbereitung von maschinenlesbaren Daten

ZENTRALARCHIV

Fortlaufend werden neue Studien, im Einzelfall auch im Auftrag des Benutzers, aus allen Bereichen der empirischen Sozialforschung beschafft. Hochschulinstitute gehö ren ebenso zu den Datengebern wie Markt- bzw. Meinungsforschungsunternehmen und andere Institutionen (z.B. wissenschaftliche Stiftungen, Verbä nde) aus dem In- und Ausland. Der enge Kontakt zu Primarforschern, Instituten und Auftraggebern von Umfragen (z.B. Ministerien, Unternehmen) ist fü r die Auswahl und Beschaffung von Daten ebenso notwendig wie die eigene Dokumentationstä tigkeit fü r empirische Forschungsprojekte.

Bei der Akquisition wird darauf geachtet, daß das Datenmaterial bestimmten methodisch-technischen Kriterien genü gt. Eine darü ber hinausgehende Bewertung durch das Zentralarchiv findet aber nicht statt. Diese bleibt der wissenschaftlichen Ö ffentlichkeit vorbehalten. Damit die Datensä tze fü r die Sekundä ranalyse genutzt werden kö nnen, sind in der Regel umfangreiche Kontroll- und Aufbereitungsarbeiten durch das Zentralarchiv erforderlich.

Zunä chst wird im Rahmen der Eingangskontrollen u.a. die Vollstä ndigkeit der Primä runterlagen (Fragebogen, Codeplan usw.) geprü ft. Eventuell vorhandene Fehlvercodungen und logische Inkonsistenzen werden bereinigt sowie die Auszahlung anhand des Codeplanes kontrolliert. Ziel der Eingangskontrollen ist die Erstellung eines Datensatzes auf Band, in dem alle Fä lle vollstä ndig vorhanden sowie eindeutig identifiziert sind und fur den Daten- und Codeplan ü bereinstimmen .

In der nachsten Bearbeitungsphase der akquirierten Datensä tze erfolgt die Erstellung eines Datensatzes mit einem Datenformat, das vom Benutzer ohne weiteren Aufwand mit modernen statistischen Analysesystemen wie SAS und SPSS ausgewertet werden kann . Im Zuge der Datenaufbereitung wird zusä tzlich ein Steuerkartensatz fü r SPSS angefertigt.

Parallel zur datentechnischen Aufbereitung erfolgt die Textaufbereitung fü r ausgewä hlte Studien Sie findet ihren Abschluß in einem maschinenlesbaren Codebuch, das den Datensatz ausfü hrlich dokumentiert (z.B. vollstä ndige Frage- und Antworttexte, Position der Variablen im Datensatz, absolute und relative Hä ufigkeiten je Variable). Die Studienbeschreibung im Datenbestandskatalog schließ lich enthä lt in komprimierter Form alle Informationen ü ber Inhalt, Methode und Entstehungszusammenhang einer Studie.

Sowohl fü r die Formatierung der Daten auf den Datenträ gern als auch fü r die Beschreibung der Daten und zugehö riger Begleitinformation (Codebuch, Studienbeschreibung) sind entsprechende Archivstandards entwickelt, die sich an den Anforderungen moderner Datenanalysesysteme orientieren und laufend mit den internationalen Partnerarchiven abgestimmt werden.