Statistik / Datenanalyse (SPSS)

1. Sitzung

SPSS

  1. Statistikpaket  mit weiter Verbreitung in der sozialwissenschaftlichen Praxis der Datenanalyse, in Markt- und Meinungsforschung, Wirtschaftswissenschaften usw. insbes. in Hochschulen und Forschungsinstituten.
  2. Durch Landeslizenz an der FSU verfügbar (Updates etwa jährlich, Lizenzerneuerung jährlich)
  3. Aktuelle Version: 11.5 / 13 (14)
  4. Studentenversion (englisch, Basismodul ohne Syntax, eingeschränkt bzgl. Variablen- und Fallzahl):
    Studentenversion, www.bsb.de
  5. SPSS Inc. www.spss.com, weitere Infos: Raynalds SPSS Tools ...
  6. Dokumentation in 'N:\data\copy\SPSS Handbücher'

Dateien, Bedienung

  1. In SPSS eine neue Datei anlegen und diese unter 'Übung1.sav' im Verzeichnis M:/data/spss speichern
  2. Begriffe: Datenmatrix, Variable, Fall, Kodebuch, Analyse
  3. Arbeitstechniken (Menüs, Einstellungen, Syntax, Hilfen)
  4. Hilfen
    - Hilfemenü
    - Hilfe in den Dialogen
    - in der Ausgabe (Doppelklick, Direkthilfe im Kontextmenü)

Erstellen einer Systemdatei

  1. Variablendeklaration in der Variablenansicht
    - Datentypen, Format
    - Labels für Variable und Werte (auch für fehlende Werte)
    - fehlende Werte (einzelne, Bereiche)
    - Messniveau (metrisch, nominal, ordinal)
  2. Dateneingabe, Wertelabels anzeigen

Übung 1: Anlegen einer SPSS-Systemdatei für die Befragungsergebnisse der Excel-Sitzung.

Univariate Datenanalyse

  1. Bedienung des Menüs: Variable, Optionen, Format usw.
  2. Fehlende Werte <--> Gültige Fälle
  3. Deskriptive Statistiken
    - Häufigkeiten (Prozente, Gültige Prozente, Kumulierte Prozente; Modalwert, Median)
    - Deskriptive Statistiken (Mittelwert, Minimum, Maximum, Standardabweichung)
    - Explorative Datenanalyse (M-Schätzer, Konfidenzintervalle, Diagramme)

Übung 2: Durcharbeiten des Lernprogramms: Einführung, Hilfesystem, Dateneditor, Untersuchen der Auswertungsstatistik nach einzelnen Variablen

Gestaltung der Ausgabe

  1. Ausgabe wird in einem speziellen Format mit Erweiterung .SPO gespeichert
  2. Gliederung: Navigation, Bearbeiten
  3. Einstellungen für Variablen- und Werteanzeige
  4. Ausgabe
    - Texte bearbeiten (Doppelklick, Formatierung, Suche, ...)
    - Tabellen bearbeiten (Pivot-Leisten, Formate, Direkthilfe)
  5. Export in andere Dokumente
    - über Zwischenablage (Strg-C): einfügen, Inhalte einfügen (formatiert, unformatiert, Grafik)
    - über Exportfunktion: HTML, Text, Word, Excel

Grafische Darstellung

  1. Balken-, Linien-, Flächen-, Kreis-  und Streudiagramme
  2. Erstellen eines Balkendiagramms (Bedeutung der Balken, Kategorienachse)
  3. Bearbeiten des Diagramms im Diagrammeditor (Schrift, Farbe, Rahmen, Achsen, Legenden, Titel, ...)

Übung 3: Berechnen Sie für die Variablen der Arbeitsdatei aus Übung 1 entsprechende deskriptive Statistiken, gestalten Sie für eine nominale Variable ein Diagramm, bereiten Sie die Ausgabe auf (Überflüssiges löschen, Kommentare, Ihr Name und Datum). Das Ergebnis ist als Datei 'Übung 1.spo' in M:\data\spss zu speichern. Die Ausgabe wird in Word exportiert, dort nachbearbeitet und als 'Übung 1 SPSS.doc' ebenfalls in M:\data\spss gespeichert.


2. Sitzung

Der Datensatz ALLBUS 2000

  1. Der ALLBUS2000-Datensatz beinhaltet die wesentlichen Ergebnisse der allgemeinen Bevölkerungsumfrage des ZUMA Mannheim im Jahr 2000.
  2. Die ALLBUS-Daten werden von der GESIS (Zentralarchiv Köln) zur Verfügung gestellt.

Erschließung eines Datensatzes

  1. Codebuch s. file:///N:/data/allbus/Codebook/allbus00.pdf
  2. Variablenansicht, Extras - Variablen, Extras - Datei-Info

SPSS-Syntax

  1. Arbeitsweise von SPSS:
    - über Menüs interaktiv Funktionen auswählen
    - OK generiert entsprechenden SPSS-Befehl, der automatisch ausgeführt wird
    - Protokoll möglich: Bearbeiten - Optionen - Viewer - 'Befehle im Log anzeigen' (Beispiel DISPLAY DICTIONARY.)
  2. Syntaxfenster
    - öffnen bzw. neues anlegen
    - Befehlsaufbau (Prozedur - Optionen - Parameter - abschließender Punkt
    - Kommentare
    - Befehle ausführen
  3. Syntax aus Menüs erzeugen: 'EINFÜGEN', Syntaxhilfe

Übung 4: Erzeugen geeigneter Variablen-Listen mit dem DISPLAY-Befehl. Suchen von Variablen im Ausgabefenster: Geschlecht, Einkommen, Beruf, Vertrauen in Bundesregierung und Universitäten

Auswahl und Vorbereitung von Beispieldaten

  1. Auswahl von Variablen für den Fragekomplex Einkommen (nur mit Syntax möglich)
    GET FILE='n:\data\allbus\allbus00.sav'
        KEEP v3, v234, v245, v256, v285, v219, v220, v466, v488, v216, v486, v544, v836.
  2. Umbenennen der Variablen (auch in der Variablenansicht)
    RENAME VARIABLES
        (v3=ostwest) (v234=berutaet) (v245=b_gruppe) (v256=oeffdien)
        (v285=famstand) (v219=alter) (v220=a_gruppe) (v466=laender) (v488=h_person)
        (v216=geschl) (v486=e_netto) (v544=h_netto) (v836=ow_gew).
  3. Speichern der Ergebnisdatei (Datei - Speichern unter)
    SAVE OUTFILE 'm:\data\spss\sel00n.sav'.
  4. Übersicht über die erhaltenen Variablen
    DISP VARIABLES.
    Name       Pos  Level    Print Fmt     Write Fmt     Missing Values
    OSTWEST      1  Ordinal  F1            F1
    BERUTAET     2  Ordinal  F2            F2            99 thru highest
    B_GRUPPE     3  Ordinal  F2            F2            99 thru highest; 0
    OEFFDIEN     4  Ordinal  F1            F1            9 thru highest; 0
    FAMSTAND     5  Ordinal  F1            F1            9 thru highest
    ALTER        6  Ordinal  F3            F3            999 thru highest
    A_GRUPPE     7  Ordinal  F1            F1            9 thru highest
    LAENDER      8  Ordinal  F2            F2            99 thru highest; 0
    H_PERSON     9  Ordinal  F2            F2            99 thru highest
    GESCHL      10  Ordinal  F1            F1            9 thru highest
    E_NETTO     11  Scale    F5            F5            99997 thru highest; 0
    H_NETTO     12  Ordinal  F5            F5            99997 thru highest; 0
    OW_GEW      13  Ordinal  F7.5          F7.5
    DISP LABELS.
    Name     Position  Label
    OSTWEST         1  ERHEBUNGSGEBIET: WEST - OST
    BERUTAET        2  BEFRAGTE(R) BERUFSTAETIG?
    B_GRUPPE        3  BEFR.: JETZIGE BERUFSHAUPTGRUPPE
    OEFFDIEN        4  IM OEFFENTLICHEN DIENST TAETIG?
    FAMSTAND        5  FAMILIENSTAND, BEFRAGTE(R) 
    ALTER           6  ALTER: BEFRAGTE(R)
    A_GRUPPE        7  ALTER: BEFRAGTE(R), KATEGORISIERT
    LAENDER         8  INTERVIEW: IN WELCHEM BUNDESLAND
    H_PERSON        9  ANZAHL DER HAUSHALTSPERSONEN
    GESCHL         10  GESCHLECHT, BEFRAGTE(R) 
    E_NETTO        11  BFR.:NETTOEINKOMMEN (OFFENE+LISTENANGABE)
    H_NETTO        12  HAUSHALTSEINKOMMEN <OFFENE+LISTENANGABE>
    OW_GEW         13  PERSONENBEZOGENES OST-WEST-GEWICHT
     

Untersuchungen zur Beschaffenheit der Daten, Datenmanagement

GET FILE 'n:\data\m3\sel00n.sav'.
  1. Gewichtung: Einkommen mit Ost-West-Gewicht
    * Menü: Analysieren - Deskriptive Statistiken - Deskriptive Statistiken. 
    DESCRIPTIVES VARIABLES=e_netto
      /STATISTICS=MEAN STDDEV MIN MAX .
    
    * ohne Gewichtung
    Deskriptive Statistik


    N Minimum Maximum Mittelwert Standardabweichung

    BFR.:NETTOEINKOMMEN<OFFENE+LISTENANGABE>

    2405 50 25000 2421,53 1824,748

    Gültige Werte (Listenweise)

    2405        
    * mit Gewichtung
    * Menü: Daten - Fälle gewichten - Fälle gewichten mit.
    WEIGHT BY ow_gew.
    Deskriptive Statistik


    N Minimum Maximum Mittelwert Standardabweichung

    BFR.:NETTOEINKOMMEN<OFFENE+LISTENANGABE>

    2346 50 25000 2538,50 1908,350

    Gültige Werte (Listenweise)

    2346        

  2. Selektion, Gruppierungen
    * für alle 
    * Menü: Daten - Fälle auswählen - alle Fälle.
    USE ALL. 
    FILTER OFF. 
    SPLIT FILE OFF. 
    
    * Selektiert nach Geschlecht. 
    * Menü: Daten - Fälle auswählen - Falls Bedingung zutrifft - Falls.
    COMPUTE filter_$=(geschl = 1). 
    FILTER BY filter_$. EXECUTE .
    bzw.
    COMPUTE filter_$=(geschl = 2). 
    FILTER BY filter_$. 
    EXECUTE . 
    
    * Aufgeteilt nach Geschlecht und OstWest 
    * Menü: Daten-Datei aufteilen - Ausgabe nach Gruppen aufteilen. 
    SORT CASES BY geschl ostwest . 
    SPLIT FILE 
      SEPARATE BY geschl ostwest . 
    
    * Faktorisiert mit Examine. 
    * Menü: Daten-Datei aufteilen - Ausgabe nach Gruppen aufteilen. 
    EXAMINE VARIABLES=e_netto BY geschl 
      /PLOT NONE
      /STATISTICS DESCRIPTIVES 
      /CINTERVAL 95 
      /NOTOTAL. 
    
    * Faktorisiert mit Tabelle. 
    * Menü: Analysieren - Tabellen - Einfache Tabellen - Faktor in Untergruppen angeben. 
    TABLES /FORMAT BLANK MISSING('.') 
      /OBSERVATION e_netto 
      /FTOTAL $t 'Gruppen-Gesamtwert' 
      /TABLES (geschl > e_netto + $t ) BY (ostwest > (STATISTICS) + $t )
      /STATISTICS mean( ).
  3. Prüfung der Einkommensangaben E_NETTO und H_NETTO
    COMPUTE filter_$=(e_netto ~= h_netto).
    FILTER BY filter_$.
    
    * Menü: Analysieren - Deskriptive Statistiken - Häufigkeiten. 
    FREQ H_PERSON.
    * Tatsächlich nur Mehr-Personen-Haushalte.
    Häufigkeitstabelle für ANZAHL DER HAUSHALTSPERSONEN

     
    Häufigkeit Prozent Gültige Prozente Kumulierte Prozente
    Gültig 2 PERSONEN 667 45,7 45,8 45,8
    3 PERSONEN 358 24,5 24,6 70,4
    4 PERSONEN 323 22,1 22,2 92,5
    5 PERSONEN 76 5,2 5,2 97,7
    6 PERSONEN 22 1,5 1,5 99,2
    7 PERSONEN 9 ,6 ,6 99,9
    8 PERSONEN 1 ,1 ,1 99,9
    11 PERSONEN 1 ,1 ,1 100,0
    Gesamt 1457 99,9 100,0  
    Fehlend KA 2 ,1    
    * Den Filter wieder zurücksetzen.
  4. Übersicht über die Altersverteilung in den Altersgruppen
    TABLES
      /FORMAT BLANK MISSING('.')
      /OBSERVATION alter
      /TABLES a_gruppe BY alter
      /STATISTICS  COUNT( ( F5.0 ) 'Anzahl')
                   MEAN(  'Mittelwert')
                   STDDEV(  'Std.Abweichung') .
      ALTER: BEFRAGTE<R>
    Anzahl Mittelwert Std.abweichung
    ALTER: BEFRAGTE<R>, KATEGORISIERT 18-29 JAHRE 526 24 4
    30-44 JAHRE 956 37 4
    45-59 JAHRE 782 52 5
    60-74 JAHRE 661 66 4
    75-89 JAHRE 204 80 4
    UEBER 89 JAHRE 9 92 2

  5. Berechnen neuer Variablen
    COMP beruf = berutaet.
    RECODE beruf (1 3 = 2) (2 = 1) (ELSE = 0).
    VALUE LABELS beruf
                 2  'Voll berufst./Kurzarbeit'
                 1  'halbtags'
                 0  'sonstige'.
    FREQ beruf.
    Häufigkeitstabelle für BERUF

     
    Häufigkeit Prozent Gültige Prozente Kumulierte Prozente
    Gültig sonstige 1378 43,9 43,9 43,9
    halbtags 212 6,8 6,8 50,7
    Voll berufst./Kurzarbeit 1548 49,3 49,3 100,0
    Gesamt 3138 100,0 100,0  

  6. Selektion bezüglich des Einkommens gültiger Fälle
    * nur mit gültigen Angaben und positivem Einkommen.
    SELECT IF (h_netto > 0 AND h_netto < 99990).
    SELECT IF (e_netto > 0 AND e_netto < 99990).
    SAVE OUTFILE 'm:\data\spss\sel00nk.sav'.

Übung 5: Untersuchung des Einkommens entsprechend Punkten 1-3 unter Einbeziehung des Einkommenwertes '0'.

Übung 6: Führen Sie analoge Untersuchungen für den ALLBUS 2002 durch.