More guns, less crime
Öffnen Sie den Datensatz http://www.farys.org/daten/guns.dta. Er enthält Kriminalitätsstatistiken von 50 US-amerikanischen Bundesstaaten plus Washington DC von 1977 bis 1999 (etwas Background: http://www.nber.org/papers/w9336.pdf). Die Variable law
gibt für jeden Bundesstaat und Jahr an, ob das Tragen von Waffen per Gesetz erlaubt ist. Im Folgenden untersuchen Sie den Einfluss von law
auf die Häufigkeit von Gewaltverbrechen (violent
).
Die Variablen sind:
- year
- state
- violent: Anzahl Gewaltverbrechen pro 100.000 Einwohner
- murder: Anzahl Morde pro 100.000 Einwohner
- Robbery: Anzahl Überfälle pro 100.000 Einwohner
- Prisoners: Anzahl Gefängnisinsassen pro 100.000 Einwohner (Vorjahr)
- afam: Anteil Afro-amerikaner zwischen 10 und 64 an der Bevölkerung
- cauc: Anteil Weisse zwischen 10 und 64 an der Bevölkerung
- male: Anteil Männer zwischen 10 bis 29 an der Bevölkerung
- population: Bevölkerung in Millionen
- income: Durchschnittliches Nettoeinkommen des Staats in Dollar
- density: Bevölkerung pro Quadratmeile / 1000
- law: Dummy, ob ein Gesetz in Kraft ist, dass das Tragen von Waffen gestattet (shall carry law)
Untersuchen Sie die Wirkung von law
(Erlaubnis, Waffen zu tragen) auf die Kriminalität violent
. Bauen Sie hierfür schrittweise geeignete Modelle.
Einige grundlegende Dinge sollten beachtet werden:
- Überblick verschaffen! Wie ist Y verteilt. Wie hat sich Y (
violent
) je Staat entwickelt?
- Welche Datenstruktur liegt vor, welche Modelle machen Sinn? Pooled OLS? Fixed Effects, Random Effects? (was sagt der Hausman Test?)
- Stata Kommandos:
xtset panelvar timevar
um den Datensatz als Paneldaten zu definieren. xtreg ... ,fe
und xtreg ... ,re
für Fixed- bzw. Random Effects.
- Welche Drittvariablen könnten sinnvollerweise aufgenommen werden?
- Stimmt die Inferenz oder müssen robuste/geclusterte Fehler verwendet werden?
Was lässt sich nun über die Wirkung von law
sagen?
Paneldatenmodelle für dichotome abhängige Variablen
Öffnen Sie den Datensatz http://www.farys.org/daten/shp.dta. Es handelt sich um einen Auszug aus dem Schweizer Haushaltspanel. Im Folgenden untersuchen Sie die dichotome Variable gesund
, die angibt, ob der Befragte seinen Gesundheitszustand selbst als “gesund oder sehr gesund” oder “nicht gesund bis mittelmässig” einschätzt.
-
Schätzen Sie folgende Modelle unter Verwendung von Alter, Geschlecht, Arbeitsstunden und Einkommen (jährlicher netto Arbeitslohn) als Prädiktoren. Interpretieren Sie jeweils die Schätzer und diskutieren Sie, wie weit und warum sich die Schätzer der unterschiedlichen Modelle unterscheiden.
-
Random Effects Logit
-
Fixed Effects Logit
-
Hybrides Modell
-
Bonus: Schätzen Sie Marginaleffekte für das Random Effects Modell und das Hybride Modell
-
Bonus: Schätzen Sie ein FE-Modell, aber weisen Sie die Effekte für Alter, Arbeitsstunden und Einkommen separat nach Geschlecht aus. Unterscheiden sich die Effekte für Männer und Frauen? Quizfrage: Warum ist der Schätzer des Einkommens für Männer präziser als für Frauen?