PI 6250 – Ökonometrie I
Department für Volkswirtschaftslehre, WU Wien
Basierend auf einem Foliensatz von Simon Heß, danke auch für Inputs an Gustav Pirich, Lucas Unterweger und Fynn Lohre
6. März 2025
Die Ökonometrie ist ein Teilgebiet der Volkswirtschaftslehre.
Wir beschäftigen uns mit wirtschaftlichen Fragestellungen.
Ökonometrie ist eine Art von angewandter Statistik.
Wir verwenden statistische Methoden, um Hypothesen zu überprüfen.
Die Ökonometrie ist ein Teilgebiet der Volkswirtschaftslehre.
Wir beschäftigen uns mit wirtschaftlichen Fragestellungen.
Ökonometrie ist eine Art von angewandter Statistik.
Wir verwenden statistische Methoden, um Hypothesen zu überprüfen.
Ökonometrie unterscheidet sich als Disziplin von mathematischer Statistik vor allem durch ihren Fokus auf die Probleme, die mit der Verwendung von nicht-experimentellen Daten einhergehen.
Wie sieht so eine ökonomische Fragestellung aus?
Wir müssen uns darüber Gedanken machen, welche Frage wir genau untersuchen wollen.
Wir können unsere Frage beispielsweise so formulieren:
Wenn ein:e Arbeitnehmer:in die Bildungskarenz in Anspruch nimmt, erhöht sich dann sein:ihr Lohn im weiteren Arbeitsleben?
Wir unterstellen folgendes Modell:
\[ \mathrm{Lohn} = f\left(\mathrm{Ausbildung},\mathrm{Erfahrung},\mathrm{Talent},\mathrm{Bildungskarenz,\dots}\right) \]
Der Lohn hängt von unserer Variable von Interesse, der Inanspruchnahme von Bildungskarenz, ab; aber auch von einer Reihe von anderen Faktoren.
Wie unterscheidet sich die Variable Ausbildung von der Variable Talent?
Ökonomische Theorien testen und falsifizieren
Sparen Haushalte mehr, wenn die Zinsen steigen?
Konvergieren Länder zu einem gemeinsamen Gleichgewicht?
Beziehungen zwischen ökonomischen Variablen quantifizieren
Was ist der kausale Effekt von Bildung auf Löhne?
Wie groß ist der durchschnittliche Gender Pay Gap?
Evaluation von Politikmaßnahmen
Reduziert ein Mindestlohn die Arbeitslosigkeit?
Hat eine Reduktion der Klassengröße unterschiedliche Effekte auf männliche und weibliche Schüler:innen?
Vorhersagen und Voraussagen
Um wie viel wird das BIP im nächsten Jahr steigen?
Wie volatil werden Aktienmärkte nächste Woche sein?
Angenommen, wir haben die Aufgabe bekommen, zu untersuchen:
Beeinflusst die durchschnittliche Klassengröße in einem Bezirk die Prüfungsleistung?
… und wenn ja, wie stark?
Wie vorher können wir davon ausgehen, dass es beobachtete und unbeobachtete Einflussfaktoren gibt.
CASchools
ist ein Datensatz zu Mathematik- und Lesetestleistungen in 420 kalifornischen Schulen im Jahr 1999. Erstellen wir also eine Grafik.
Zuerst bereiten wir dafür unsere Daten auf.
Was sagt uns diese Grafik? Nicht viel.
Wir haben zwei große Probleme mit dieser Analyse:
In Ökonometrie I, Ökonometrie II, und Angewandter Ökonometrie beschäftigen wir uns Schritt für Schritt damit, wie wir mit diesen Problemen umgehen können. Am Ende dieser drei Kurse sind wir in der Lage, ökonometrische Fragestellungen eigenständig zu beantworten.
Ein zusätzliches Jahr Ausbildung führt zu einem um durchschnittlich 20 % erhöhten Lohn.
Personen, die ein Jahr länger in Ausbildung waren, haben durchschnittlich einen um 20 % höheren Lohn.
Bedeuten diese beiden Aussagen das Gleiche? Nein. 🙃
Als Ökonom:innen interessieren wir uns oft für kausale Effekte, die eine bestimmte Variable auf eine andere Variable hat.
Informelle Definition: Kausalität
Wir sprechen von einem kausalen Effekt, wenn das isolierte Verändern einer Variable einen direkten, messbaren Effekt auf eine andere Variable hat.
Nehmen wir das Beispiel mit Dünger und landwirtschaftlichen Erträgen. Wie könnten wir hier einen kausalen Effekt isolieren?
Nehmen wir das Beispiel mit Dünger und landwirtschaftlichen Erträgen. Wie könnten wir hier einen kausalen Effekt isolieren?
Nehmen wir das Beispiel mit Dünger und landwirtschaftlichen Erträgen. Wie könnten wir hier einen kausalen Effekt isolieren?
Randomisierte kontrollierte Studien (Randomized Controlled Trials, RCT)
Wir weisen einer zufällig ausgewählten Studiengruppe eine Intervention zu. Eine Kontrollgruppe bekommt diese Intervention nicht. Mit einer solchen Studie können wir ein naturwissenschaftliches Experiment approximieren.
Unter bestimmten Annahmen sind unsere so erlangten Resultate valide:
Nicht immer können wir ein Experiment (RCT oder Laborexperiment) durchführen. Das hat
Coville et al. (2020) wollen herausfinden, ob Leute, die nicht für ihr Wasser gezahlt haben, schneller zahlen, wenn man ihnen das Wasser abdreht.
Coville et al. (2020) wollen herausfinden, ob Leute, die nicht für ihr Wasser gezahlt haben, schneller zahlen, wenn man ihnen das Wasser abdreht.
Cohen & Dupas (2008) untersuchen, ob Kostenbeteiligung an Malarianetzen zu weniger „verschwenderischem“ Umgang mit ihnen führt.
Cohen & Dupas (2008) untersuchen, ob Kostenbeteiligung an Malarianetzen zu weniger „verschwenderischem“ Umgang mit ihnen führt.
In vielen Fällen ist die Durchführung eines Experiments unrealistisch. In anderen Fällen ist es aus ethischen Gründen geboten, kein Experiment durchzuführen.
Oftmals sind wir also auf Beobachtungsdaten angewiesen.
Experimente werden in der ökonomischen Forschung häufiger, meistens haben wir aber (wie in anderen Sozialwissenschaften) mit Beobachtungsdaten zu tun.
Zurück zu unserem Modell zur Bildungskarenz:
\[ \mathrm{Lohn} = f\left(\mathrm{Ausbildung},\mathrm{Erfahrung},\mathrm{Talent},\mathrm{Bildungskarenz,\dots}\right) \]
Wie würde ein Datensatz aussehen, mit dem wir so eine Frage untersuchen könnten?
? | Lohn | Ausbildung | Erfahrung | Bildungskarenz |
---|---|---|---|---|
1 | 15 | 12 | 9 | Ja |
2 | 21 | 14 | 2 | Nein |
3 | 14 | 11 | 7 | Nein |
4 | 18 | 9 | 22 | Nein |
5 | … | … | … | … |
In diesem Datensatz sind Spalten Variablen und Zeilen sind Beobachtungen.
Individuen | Lohn | Ausbildung | Erfahrung | Bildungskarenz |
---|---|---|---|---|
i = 1 | 15 | 12 | 9 | Ja |
i = 2 | 21 | 14 | 2 | Nein |
i = 3 | 14 | 11 | 7 | Nein |
i = 4 | 18 | 9 | 22 | Nein |
i = 5 | … | … | … | … |
Querschnittsdaten
Querschnittsdaten (engl. cross-sectional data) bestehen aus einer Stichprobe von Individuen, Haushalten, Firmen, Städten, Ländern, etc., über die zu einem Zeitpunkt Daten gesammelt werden. Wir versehen einzelne Beobachtungen mit dem Index \(i\). Die Anzahl der Beobachtungen bezeichnen wir als \(N\).
Zeitpunkte | Lohn | Ausbildung | Erfahrung | Bildungskarenz |
---|---|---|---|---|
t = 2021 | 0 | 8 | 0 | Nein |
t = 2022 | 0 | 9 | 0 | Nein |
t = 2023 | 12 | 10 | 1 | Nein |
t = 2024 | 14 | 10 | 2 | Ja |
t = 2025 | … | … | … | … |
Zeitreihendaten
Zeitreihendaten (engl. time series data) bestehen aus einer Stichprobe von Zeitpunkten, zu denen Daten über dasselbe Individuum bzw. dieselbe Beobachtungseinheit gesammelt werden. Wir versehen einzelne Beobachtungen mit dem Index \(t\). Die Anzahl der Beobachtungen bezeichnen wir als \(T\).
Individuen | Zeitpunkte | Lohn | Ausbildung | Erfahrung | Bildungskarenz |
---|---|---|---|---|---|
i = 1 | t = 2023 | 20 | 14 | 1 | Nein |
i = 2 | t = 2023 | 12 | 10 | 1 | Nein |
i = 1 | t = 2024 | 21 | 14 | 2 | Nein |
i = 2 | t = 2024 | 14 | 10 | 2 | Nein |
i = 1 | t = 2025 | … | … | … | … |
Panel-Daten
Panel-Daten (engl. panel data) haben sowohl eine Individuums- als auch eine Zeitkomponente. Die einzelnen Beobachtungen haben einen Index \(i\) und einen Index \(t\). Wir beobachten \(N\) Einheiten über \(T\) Perioden, haben also \(NT\) Beobachtungen.