Ehescheidung

Öffnen Sie die Daten http://www.farys.org/daten/sams98.dta. Es handelt sich um einen Auszug aus dem Schweizer Arbeitsmarktsurvey 1998. Variablen sind:

Datenaufbereitung

Damit wir Ereignisdatenmodelle verwenden können, müssen die Daten etwas vorbereitet werden. Nutzen Sie hierfür die folgenden Code-Blöcke.

  1. Brauchen wir eine geeignete Skala in der alle Zeitpunkte gemessen sind. Z.B. Jahrhundertmonate (1 entspricht dem Januar 1900):
  2. use http://www.farys.org/daten/sams98.dta, clear
    generate geburt = a5j * 12 + a5m
    generate heirat = h9j * 12 + cond(h9m>0, h9m, 7)
    generate haushalt = h10j * 12 + cond(h10m>0, h10m, 7)
    generate scheidung = h15j * 12 + cond(h15m>0, h15m, 7) if h15j>0
    generate todpartner = h17j * 12 + cond(h17m>0, h17m, 7) if h17j>0
    generate ersteskind = h19_1j * 12 + cond(h19_1m>0, h19_1m, 7) if h19_1j>0
    generate interview = 98 * 12 + monat
  3. Brauchen wir eine Zustandsvariable, ob die Person geschieden ist:
  4. Es macht Sinn, mehrere Situationen zu unterscheiden:
    recode h1 (1 2 = 1) (3 = 3) (4 = 2), into(ehestatus)

    Zudem betrachten wir der Einfachheit halber nur die erste Ehe. Daher muss für Verheiratete und Geschiedene geprüft werden ob sie verheiratet/geschieden in erster oder späterer Ehe sind und ggf. die Zustandsvariable angepasst werden (z.B. ist “verheiratet in zweiter Ehe” eigentlich ein “geschieden in erster Ehe”)

    replace ehestatus = 2 if h14==3
    replace ehestatus = 3 if h14==4
    
    label define ehestatus 1 "verheiratet" 2 "geschieden" 3 "verwitwet"
    label values ehestatus ehestatus
    label variable ehestatus "Status (erste) Ehe"
  5. Aus Heiratsmonat, Interviewmonat, Todesmonat und Scheidungsmonat lässt sich die Ehedauer für diverse Szenarien berechnen:
  6. gen double ehedauer = interview + 1 - heirat if ehestatus==1
    replace ehedauer = scheidung + 1 - heirat if ehestatus==2
    replace ehedauer = todpartner + 1 - heirat if ehestatus==3
    replace ehedauer = . if ehedauer<=0

    Nicht in allen Fällen sind die Angaben konsistent, denn für die Ehedauer resultieren zum Teil negative Werte. Es wäre nun sinnvoll, diesen Fällen genauer nachzugehen. Um den Rahmen der Übung nicht zu sprengen, wollen wird diese Fälle hier aber einfach ausschliessen:

    fre ehedauer if ehedauer<=0
    replace ehedauer = . if ehedauer<=0
  7. Abschliessend bauen wir noch die Variable die das Ereignis (Scheidung) anzeigt:
  8. generate byte geschieden = ehestatus==2 if ehestatus<.

Übungsaufgaben

  1. Berechnen Sie die Überlebens- und Hazardfunktion mit Hilfe des Product-Limit-Schätzers (Befehl sts). Stellen Sie die Ergebnisse grafisch dar. Definieren Sie hierfür zunächst den Datensatz als Ereignisdaten (stset).
  2. Testen Sie folgende Hypothesen:

    Berechnen Sie dazu den Product-Limit-Schätzer für die Überlebens- und Hazardfunktionen und führen Sie Gruppenvergleiche durch. Kohabitation liegt vor, wenn das Datum der Gründung eines gemeinsamen Haushalts vor dem Datum der Eheschliessung liegt. Nehmen Sie weiterhin vereinfachend an, dass gemeinsame Kinder vorhanden sind, wenn das Geburtsdatum des ersten Kindes vor dem Scheidungsdatum liegt.
  3. Schätzen Sie für verschiedene Verteilungen parametrische Modelle (streg) die beide Kovariaten (Kohabitation und Kind) beinhalten.
  4. Erweitern Sie das Exponentialmodell nun zu einem “piecewise exponential model” (siehe stsplit).
  5. Prüfen Sie erneut die beiden Hypothesen:
    1. Voreheliches Zusammenleben (Kohabitation) erhöht das Scheidungsrisiko (Selektions-effekt).
    2. Das Scheidungsrisiko wird durch das Vorhandensein gemeinsamer Kinder verringert.
    Verwenden Sie hierfür diesmal jedoch ein semi-parametrisches Modell (Cox-Regression; in Stata stcox).
  6. Bonus: Erzeugen Sie einige Kontrollvariablen und erweitern Sie das Modell um diese. Geben Sie auch eine kurze Interpretation der Befunde aus den Kontrollvariablen.
  7. Prüfen Sie die Proportionalitätsannahme (estat phtest, detail). Betrachten Sie zudem für kritische Kovariate stcox diagnostic plots (z.B. stphplot).
  8. Um die zweite Hypothese adäquat zu prüfen, sollte der zeitveränderliche Charakter des Vorhandenseins gemeinsamer Kinder berücksichtigt werden. Führen Sie die Berechnungen (Cox-Regression ohne und ggf. mit Drittvariablen) mit einer zeitveränderlichen Variable aufgrund des Geburtsdatums des ersten Kindes durch (siehe stsplit). Unterscheiden Sie zudem, ob es sich um ein voreheliches Kind handelt oder nicht. Prüfen Sie auch hier die Proportionalitätsannahme.

Modelle für diskrete Zeit

Laden Sie die Daten http://www.farys.org/daten/dropout.dta. Es handelt sich um Daten im long-Format (mehrere Zeitpunkte pro id) Die Variable eventtype enthält die Info, ob die jeweilige Person in der betrachteten Periode immatrikuliert war oder abgeschlossen hat. Personen die 2014 weder immatrikuliert sind noch ein Diplom (vorher) erworben haben sind ein Dropout (Abbruch des Studiums).

Es müssen drei Fälle unterschieden werden:

  1. Erzeugen Sie eine Variable diplom (0 oder 1) ob in der betrachteten Periode ein Abschluss erlangt wurde.
  2. Erzeugen Sie nun einen Dummy dropout, der 1 wird, wenn die letzte Beobachtung einer Person vor 2014 war und kein Abschluss erreicht wurde.
  3. Die Beobachtungen der einzelnen Personen beziehen sich auf unterschiedliche Zeitspannen. Zur Ereignisdatenanalyse müssen alle Personen am Startdatum ausgerichtet werden. Erzeugen Sie dafür eine neue Variable studienjahr, die pro id abbildet in welchem Studienjahr sich die Person zum jeweiligen Zeitpunkt befunden hat.
  4. Fassen Sie Studienjahre grösser gleich 6 zusammen in eine Kategorie. Schätzen Sie dann, inkl. Periodendummies, Geschlecht und Alter mehrere Modelle. Was lässt sich über die Schätzer (Geschlecht/Alter/Studienjahr) sagen?