A.6.6 Datenauswertung Häufigkeitsauszählungen
Der erste Schritt der eigentlichen Datenauswertung ist die Erstellung von einfachen Häufigkeitsauszählungen und Aggregatsstatistiken (statistischen Maßzahlen) von allen Variablen. Dies ist zugleich auch für die noch nicht abgeschlossene Datenkontrolle sehr wichtig.
In der Datei G92-A.TXT finden Sie die Ergebnisse solcher einfachen Auswertungen.
FREQUENCIES
|
Häufigkeitsauszählung der Werte von Variablen.
|
Beispiel: FREQUENCIES A110
|
DESCRIPTIVES
|
Berechnung statistischer Maßzahlen
(Median, aritmetischer Mittelwert u.a.)
|
Beispiel: DESCRIPTIVES All.
|
Der Vorteil der Prozedur DESCRIPTIVES besteht in der kompakten Form der Druckausgabe, da die statistischen Maßzahlen zusammen mit dem Variablennamen und dem Label in einer Zeile dargestellt werden.
Weitere statistische Maßzahlen zur Analyse der Verteilung einer Variablen (z.B. der Median) lassen sich mit der STATISTICS-Anweisung der Prozedur FREQUENCIES erzeugen (siehe SPSS Manual).
In der Phase der Datenkontrolle interessieren allerdings die statistischen Maßzahlen nicht, sondern die Druckausgabe der FREQUENCIES-Prozedur wird lediglich benötigt, um bei jeder einzelnen Variable zu prüfen, ob die Werte plausibel erscheinen. Zwei Fälle sind bei der Fehlersuche zu unterscheiden:
-
Liegen die Werte im zulässigen Wertebereich?
-
Falls z.B. die möglichen Antworten nur im Bereich der Werte von 1 bis 5 liegen, ist der Wert 6 unzulässig - ein "wild code", der anzeigt, daß bei der Datenerfassung Fehler gemacht wurden.
-
Sind die Werte plausibel, wenn man weitere Angaben desselben Befragten berücksichtigt?
-
Wenn ein Befragter z.B. angibt, daß er noch keine Beschäftigung gefunden hat (A362 = 1), dann sollte er sonst keine weiteren Angaben zu den Methoden der Stellenfindung (kein gültiger Wert bei A346 to A363) machen.
Die Häufigkeitsauszählungen informieren nur darüber, ob überhaupt Fehler in den Daten vorliegen. Zur genaueren Bestimmung des Fehlers und der etwaigen Datenkorrektur ist es notwendig zu wissen, bei welchem Fall der Fehler aufgetreten ist.
Die Prozedur LIST erlaubt es, die Werte von Variablen bei einzelnen Fällen zu betrachten.
Bei sehr vielen Fällen ist das Ergebnis solcher Listen sehr unübersichtlich. Mit Hilfe einer Anweisung zur Auswahl von Fällen, können gezielt nur Fälle gelistet werde, deren Werte betrachtet werden sollen.
TEMPORARY.
SELECT IF
|
Führt die folgende Prozedur nur für ausgewählte Fälle aus
|
Beispiel:
SELECT IF (A362 EQ 1).
|
Um die Daten korrigieren zu können, ist es meist notwendig, die Fragebogen wieder zur Hand zu nehmen.
Die Datenkorrekturen können
-
direkt in den Rohdaten erfolgen (Vorsicht, sonst werden neue Fehler produziert);
-
mit DATA ENTRY im Systemfile durchgeführt werden (die Rohdaten bleiben dann fehlerhaft, auch hier muß sehr sorgfältig gearbeitet werden, damit nicht neue Fehler auftreten);
-
oder mit IF-Anweisungen ebenfalls in der Systemdatei erfolgen (die Rohdaten bleiben dann fehlerhaft, aber die Fehlerkorrektur bleibt transparent und kann jederzeit überprüft werden).
Die sicherste Form der Datenkorrektur ist die letzte Variante, die allerdings zu einer recht umfangreichen Datenkorrekturdatei führen kann. Nehmen wir an, die Überprüfung der Fragebogen der Befragten mit den Fallnummern 7 und 9 hat ergeben, daß sie tatsächlich "noch keine Beschäftigung" gefunden haben, dann müssen wir die übrigen Variablen, die zur Frage 3.2 gehören und die angekreuzt wurden, korrigieren. Eine solche Datenkorrektur mit IF-Anweisungen könnte folgendermaßen gestaltet sein:
* -------------------------------------------.
IF (A101 EQ 007) A347 = 0.
IF (A101 EQ 007) A351 = 0.
IF (A101 EQ 007) A357 = 0.
IF (A101 EQ 007) A360 = 0.
IF (A101 EQ 007) A361 = 0.
IF (A101 EQ 007) A363 = 0.
* -------------------------------------------.
IF (A101 EQ 009) A347 = 0.
IF (A101 EQ 009) A351 = 0.
IF (A101 EQ 009) A357 = 0.
IF (A101 EQ 009) A360 = 0.
IF (A101 EQ 009) A361 = 0.
IF (A101 EQ 009) A363 = 0.
* -------------------------------------------.
IF
|
Bedingte Veränderung des Wertes von Variablen
|
Beispiel:
IF (A101 EQ 007) A347 = 0.
|
Um später die Korrekturen eventuell nachvollziehen zu können, ist es ratsam, alle Rohdatenkorrekturen, die Systemdateien verändern, in einer Korrekturdatei (Name z.B. G92-KORR.DEF') zu sammeln. Auch Änderungen in den Var Labels, Value Labels und die Bildung neuer Variabeln sollten Sie in einer Datei sammeln. Sie können dann ausgehend von der Ur-Systemdatei (G92-A.SYC) jederzeit leicht eine neue Systemdatei bilden. Wenn Sie dagegen Änderungen in einer Systemdatei vornehmen (z.B. Recodieren von Werten), diese veränderte Systemdatei abspeichern und die Änderungen nicht explizit dokumentieren, können Sie später, bei der Abfassung des Untersuchungsberichts, möglicherweise nicht mehr rekonstruieren, wie ihre Ergebnisse zu interpretieren sind. Auch kann es sich später herausstellen, daß es notwendig ist, frühere Recodierungen zu revidieren.
Dostları ilə paylaş: |