Öffnen Sie die Daten http://www.farys.org/daten/sams98.dta. Es handelt sich um einen Auszug aus dem Schweizer Arbeitsmarktsurvey 1998. Variablen sind:
Damit wir Ereignisdatenmodelle verwenden können, müssen die Daten etwas vorbereitet werden. Nutzen Sie hierfür die folgenden Code-Blöcke.
use http://www.farys.org/daten/sams98.dta, clear
generate geburt = a5j * 12 + a5m
generate heirat = h9j * 12 + cond(h9m>0, h9m, 7)
generate haushalt = h10j * 12 + cond(h10m>0, h10m, 7)
generate scheidung = h15j * 12 + cond(h15m>0, h15m, 7) if h15j>0
generate todpartner = h17j * 12 + cond(h17m>0, h17m, 7) if h17j>0
generate ersteskind = h19_1j * 12 + cond(h19_1m>0, h19_1m, 7) if h19_1j>0
generate interview = 98 * 12 + monat
recode h1 (1 2 = 1) (3 = 3) (4 = 2), into(ehestatus)
Zudem betrachten wir der Einfachheit halber nur die erste Ehe. Daher muss für Verheiratete und Geschiedene geprüft werden ob sie verheiratet/geschieden in erster oder späterer Ehe sind und ggf. die Zustandsvariable angepasst werden (z.B. ist “verheiratet in zweiter Ehe” eigentlich ein “geschieden in erster Ehe”)
replace ehestatus = 2 if h14==3
replace ehestatus = 3 if h14==4
label define ehestatus 1 "verheiratet" 2 "geschieden" 3 "verwitwet"
label values ehestatus ehestatus
label variable ehestatus "Status (erste) Ehe"
gen double ehedauer = interview + 1 - heirat if ehestatus==1
replace ehedauer = scheidung + 1 - heirat if ehestatus==2
replace ehedauer = todpartner + 1 - heirat if ehestatus==3
replace ehedauer = . if ehedauer<=0
Nicht in allen Fällen sind die Angaben konsistent, denn für die Ehedauer resultieren zum Teil negative Werte. Es wäre nun sinnvoll, diesen Fällen genauer nachzugehen. Um den Rahmen der Übung nicht zu sprengen, wollen wird diese Fälle hier aber einfach ausschliessen:
fre ehedauer if ehedauer<=0
replace ehedauer = . if ehedauer<=0
generate byte geschieden = ehestatus==2 if ehestatus<.
sts
). Stellen Sie die Ergebnisse grafisch dar. Definieren Sie hierfür zunächst den Datensatz als Ereignisdaten (stset
).
Testen Sie folgende Hypothesen:
streg
) die beide Kovariaten (Kohabitation und Kind) beinhalten.
stsplit
).
stcox
).
estat phtest, detail
). Betrachten Sie zudem für kritische Kovariate stcox
diagnostic plots (z.B. stphplot
).
stsplit
). Unterscheiden Sie zudem, ob es sich um ein voreheliches Kind handelt oder nicht. Prüfen Sie auch hier die Proportionalitätsannahme.
Laden Sie die Daten http://www.farys.org/daten/dropout.dta. Es handelt sich um Daten im long-Format (mehrere Zeitpunkte pro id
) Die Variable eventtype
enthält die Info, ob die jeweilige Person in der betrachteten Periode immatrikuliert war oder abgeschlossen hat. Personen die 2014 weder immatrikuliert sind noch ein Diplom (vorher) erworben haben sind ein Dropout (Abbruch des Studiums).
Es müssen drei Fälle unterschieden werden:
diplom
(0 oder 1) ob in der betrachteten Periode ein Abschluss erlangt wurde.
dropout
, der 1 wird, wenn die letzte Beobachtung einer Person vor 2014 war und kein Abschluss erreicht wurde.
studienjahr
, die pro id abbildet in welchem Studienjahr sich die Person zum jeweiligen Zeitpunkt befunden hat.
logit
)
cloglog
)
reg
)