diff --git a/Empirisches Seminar: Regionale Unterschiede in der Mietpreisentwicklung/Modell-2_regionaler_West_Ost_Vergleich.do b/Empirisches Seminar: Regionale Unterschiede in der Mietpreisentwicklung/Modell-2_regionaler_West_Ost_Vergleich.do new file mode 100644 index 0000000..c87ec59 --- /dev/null +++ b/Empirisches Seminar: Regionale Unterschiede in der Mietpreisentwicklung/Modell-2_regionaler_West_Ost_Vergleich.do @@ -0,0 +1,662 @@ +*######################################################################### +* Autor: Marcel Weschke +* E-Mail: marcel.weschke@directbox.de +* +* Seminar Thema: Regionale Unterschiede in der Mietpreisentwicklung. +* Regressionsanalyse - West- / Ostdeutschland - Modell 2 +*######################################################################### + +* Load the zh dataset: +*use "K:\Wissenschaftlicher Mitarbeiter\Lehre\Empirisches Seminar\SOEP 50\zhgen.dta", clear +use "/home/marcel/Desktop/SOEP-CORE.v37_data/Stata/raw/zhgen.dta", clear + +* Load and append the beh dataset: +*append using "K:\Wissenschaftlicher Mitarbeiter\Lehre\Empirisches Seminar\SOEP 50\behgen.dta" +append using "/home/marcel/Desktop/SOEP-CORE.v37_data/Stata/raw/behgen.dta" + + + +* ################################ +* Pre-code - adjust for inflation: +* ################################ +* Quelle: https://www-genesis.destatis.de/genesis/online +* Verbraucherpreisindex (CPI) für 2009, 2014, 2020 und 2022 +gen cpi_2009 = 87.2 / 100 // CPI für 2009 als Bruchteil +gen cpi_2014 = 94.0 / 100 // CPI für 2014 als Bruchteil +gen cpi_2020 = 100.0 / 100 // CPI für 2020 als Bruchteil -> Basisjahr +gen cpi_2022 = 110.2 / 100 // CPI für 2022 als Bruchteil -> Betrachtungsjahr + +* Inflationsfaktoren zu den Jahren 2009 und 2014 mit Basisjahr 2020 und Betrachtungsjahr 2022: +bysort hid (syear): gen inflationsfaktor_2009 = cpi_2022 / cpi_2009 +bysort hid (syear): gen inflationsfaktor_2014 = cpi_2022 / cpi_2014 + + +* Setting up the regression variables +* #################### +* NUMERIC VARIABLES: +* #################### + +* Generate the "miete" variable +gen miete = . +replace miete = rent09 if syear == 2009 +replace miete = rent14 if syear == 2014 +* Display the sum of miete values less than or equal to 0 +*tab miete if miete <= 50 +sum miete if miete <= 0 +drop if miete <= 0 +* 6897 observations deleted + +* Next: Nominal price data in Euro converted to real Euro term +* Anpassung der Einkommenswerte von 2009 und 2014 auf 2022: +bysort hid (syear): replace miete = miete * inflationsfaktor_2009 if syear == 2009 +bysort hid (syear): replace miete = miete * inflationsfaktor_2014 if syear == 2014 + + + + +* Generate the "wohnfläche" variable +gen wohnfläche = . +replace wohnfläche = size09 if syear == 2009 +replace wohnfläche = size14 if syear == 2014 +sum wohnfläche if wohnfläche <= 0 +*no negative values, good + + +* PLOT: Wohnfläche VS Quadratmeterpreis: +graph twoway (scatter Quadratmeterpreis wohnfläche, mfcolor(gray) mlcolor(gray) title("Direktbeziehung zwischen der Wohnfläche und dem Quadratmeterpreis", size(small)) xtitle("Wohnfläche in qm", size(small)) ytitle("Quadratmeterpreis in EUR", size(small))) (lfit Quadratmeterpreis wohnfläche) + + + + +* Generate the "HH_nettoeinkommen" variable +gen HH_nettoeinkommen = . +replace HH_nettoeinkommen = hinc09 if syear == 2009 +replace HH_nettoeinkommen = hinc14 if syear == 2014 +sum HH_nettoeinkommen if HH_nettoeinkommen <= 0 +* So there are 292 observations smallerequal to 1 +*su HH_nettoeinkommen +drop if HH_nettoeinkommen <= 1 +* Rescale HH_nettoeinkommen / 1000 to make it better interpretable: +replace HH_nettoeinkommen = (HH_nettoeinkommen/1000) + +* Next: Nominal price data in Euro converted to real Euro term +* Anpassung der Einkommenswerte von 2009 und 2014 auf 2022: +bysort hid (syear): replace HH_nettoeinkommen = HH_nettoeinkommen * inflationsfaktor_2009 if syear == 2009 +bysort hid (syear): replace HH_nettoeinkommen = HH_nettoeinkommen * inflationsfaktor_2014 if syear == 2014 + + +* PLOT: Nettohaushaltseinkommen VS Quadratmeterpreis: +graph twoway (scatter Quadratmeterpreis HH_nettoeinkommen, mfcolor(gray) mlcolor(gray) title("Direktbeziehung zwischen dem Nettohaushaltseinkommen und dem Quadratmeterpreis", size(small)) xtitle("Nettohaushaltseinkommen in EUR", size(small)) ytitle("Quadratmeterpreis in EUR", size(small))) (lfit Quadratmeterpreis HH_nettoeinkommen) + + + +* Generate the Quadratmeterpreis variable +gen Quadratmeterpreis = miete / wohnfläche + +* Generate the ln(Quadratmeterpreis) variable +gen ln_Quadratmeterpreis = log(Quadratmeterpreis) + + + +* #################### +* FACTOR VARIABLES: +* #################### +* Generate the "ortschaft" variable, where: +* West: ortschaft==1 +* Ost: ortschaft==0 +gen ortschaft = . +replace ortschaft = nuts109_ew if syear == 2009 +replace ortschaft = nuts114_ew if syear == 2014 +tab ortschaft +*Westdeutschland +replace ortschaft = 1 if ortschaft == 21 +*Ostdeutschland +replace ortschaft = 0 if ortschaft == 22 +tab ortschaft +* 1984 observations in the Ost area +* 4804 observations in the West area + + +* Create the "räume" variable +gen räume = . +replace räume = room09 if syear == 2009 +replace räume = room14 if syear == 2014 +tab räume +*no negative values, good + + +* Create the "mietertyp" variable (to filter out Eigentümer?) +gen mietertyp = . +replace mietertyp = owner09 if syear == 2009 +replace mietertyp = owner14 if syear == 2014 +tab mietertyp +* Note: "1" would represents Eigentümer.Eigentümer: +* drop if mietertyp == 1 + + +* Create the "terasse_balkon" variable +gen terasse_balkon = . +replace terasse_balkon = eqpter09 if syear == 2009 +replace terasse_balkon = eqpter14 if syear == 2014 +tab terasse_balkon +* So there are 5 observations with -1 +drop if terasse_balkon == -1 + +* value 1: [1] Ja +* value 2: [2] Nein + + + +* Create the "keller" variable +gen keller = . +replace keller = eqpbas09 if syear == 2009 +replace keller = eqpbas14 if syear == 2014 +tab keller +* So there are 3 observations with -1 +drop if keller == -1 + + +* Create the "garten" variable +gen garten = . +replace garten = eqpgar09 if syear == 2009 +replace garten = eqpgar14 if syear == 2014 +tab garten +* So there are 6 observations with -1 +drop if garten == -1 + + +* Identify households surveyed in both years +bysort hid (syear): gen tag = _N +tab tag +* So there are 4214 unique observations with just 1 year of data +drop if tag == 1 + + + +* ######################### +* Check for missing values: +* ######################### +sum ln_Quadratmeterpreis Quadratmeterpreis miete wohnfläche HH_nettoeinkommen räume ortschaft terasse_balkon keller garten if missing(ln_Quadratmeterpreis) | missing(Quadratmeterpreis) | missing(miete) | missing(wohnfläche) | missing(HH_nettoeinkommen) | missing(räume) | missing(ortschaft) | missing(terasse_balkon) | missing(keller) | missing(garten) + +* Remove rows with missing values +*drop if missing(ln_Quadratmeterpreis) | missing(Quadratmeterpreis) | missing(miete) | missing(wohnfläche) | missing(HH_nettoeinkommen) | missing(räume) | missing(ortschaft) | missing(terasse_balkon) | missing(keller) | missing(garten) + + +* #################################### +* Setting up the panel data structure: +* #################################### +gen period = 1 if syear == 2009 +replace period = 2 if syear == 2014 +xtset hid period // deklariere Identifier und Zeitvariable + + + + +* ############################ +* CHECK FOR MOVED household's: +* ############################ +* Create a new variable moved +* Create the dummy variable which indicates whether a household moved and its location (+origion information) or not. + + +*gen move_dummy = . +bysort hid (syear): gen region_moved_dummy = 1 if ortschaft[1] != ortschaft[_N] & syear[1] == 2009 & syear[_N] == 2014 +* Recode move_dummy based on the specific conditions +bysort hid (syear): replace region_moved_dummy = 0 if ortschaft[1] == ortschaft[_N] +bysort hid (syear): replace region_moved_dummy = 1 if ortschaft[1] == 0 & ortschaft[_N] == 1 +bysort hid (syear): replace region_moved_dummy = 2 if ortschaft[1] == 1 & ortschaft[_N] == 0 +bysort hid (syear): replace region_moved_dummy = 3 if ortschaft[1] == 0 & ortschaft[_N] == 0 +tab region_moved_dummy +*gen diff_move_dummy = d.move_dummy + + +*Ziel dieser zusätzlichen Variable: -> Aussage über die Änderung durch Ausgangsmiete, wie im Paper. +bysort hid (syear): gen apartment_moved_dummy = 0 if wohnfläche[1] == wohnfläche[_N] & syear[1] == 2009 & syear[_N] == 2014 +bysort hid (syear): replace apartment_moved_dummy = 1 if wohnfläche[1] != wohnfläche[_N] & syear[1] == 2009 & syear[_N] == 2014 +tab apartment_moved_dummy +* 1242 sind in ihrer Wohnung geblieben +* 1318 sind umgezogen im laufe der Zeit + + + +* REMINDER: ! +************************************************** +* Variable: ortschaft +* 0: Ostdeutschland +* 1: Westdeutschland + +* Variable: region_moved_dummy +* 0: in West-Region geblieben +* 1: West zu Ost gezogen +* 2: Ost zu West gezogen +* 3: in Ost-Region geblieben + +* Variable: apartment_moved_dummy +* 0: Wöhnungsgröße hat sich nicht verändert +* 1: Wohnungsgröße hat sich verändert +************************************************** + + + + +* ############################ +* Generating diff_Variable's : +* ############################ + +bysort hid (syear): gen diff_ortschaft = ortschaft - ortschaft[_n-1] +bysort hid (syear): replace diff_ortschaft = 2 if diff_ortschaft == -1 +graph bar (count), over(diff_ortschaft) + +bysort hid (syear): gen diff_räume = räume - räume[_n-1] +*gen diff_räume = räume - räume[_n-1] +graph bar (count), over(diff_räume) + +* Erklärung der Werte: +* 0 Nullwert: +* Dies würde bedeuten, dass die Anzahl der Räume im Haushalt zwischen 2009 und 2014 unverändert geblieben ist. +* 1,... Positive Werte: +* Dies würde bedeuten, dass die Anzahl der Räume im Haushalt im Jahr 2014 im Vergleich zu 2009 zugenommen hat. +* -1,... Negativer Werte: +* Dies würde bedeuten, dass die Anzahl der Räume im Haushalt im Jahr 2014 im Vergleich zu 2009 abgenommen hat. -> Wobei ich diesen Wert zu "2" umkodiere, da keine negativen Werte erlaubt sind !! + +* Plot Ortschaft-Verteilung (Land und Stadt) +graph bar, over(räume) over(ortschaft, relabel(1 "Land" 2 "Stadt")) /// +title("Anzahl der Räume je Wohneinheit und Ortschaft:", size(small)) /// +ytitle("Prozent der Wohneinheiten", size(small)) /// +bar(1, color(gray) fcolor(gray)) + +* Plot Ortschaft-Verteilung (Land und Stadt) +graph bar, over(diff_räume) over(ortschaft, relabel(1 "Land" 2 "Stadt")) /// +title("{&Delta} Anzahl der Räume je Wohneinheit und Ortschaft:", size(small)) /// +ytitle("Prozent der Wohneinheiten", size(small)) /// +bar(1, color(gray) fcolor(gray)) + + + +bysort hid (syear): gen diff_terasse_balkon = terasse_balkon - terasse_balkon[_n-1] +bysort hid (syear): replace diff_terasse_balkon = 2 if diff_terasse_balkon == -1 +*gen diff_terasse_balkon = terasse_balkon - terasse_balkon[_n-1] +*graph bar (count), over(diff_terasse_balkon) +graph bar, over(diff_terasse_balkon ) over(ortschaft, relabel(1 "Land" 2 "Stadt")) /// +title("Änderung nach Umzug, Terasse/Balkon je Wohneinheit und Ortschaft:", size(small)) /// +ytitle("Prozent der Wohneinheiten", size(small)) /// +bar(1, color(gray) fcolor(gray)) + +* Erklärung der Werte: +* 0 Nullwert: +* Dies würde bedeuten, dass "terasse_balkon" im Haushalt zwischen 2009 und 2014 unverändert geblieben ist. +* 1 Positive Werte: +* Dies würde bedeuten, dass "terasse_balkon" im Haushalt im Jahr 2014 im Vergleich zu 2009 zugenommen hat. (neue Wohnung MIT Terasse/Balkon) +* -1 Negativer Werte: +* Dies würde bedeuten, dass die Anzahl der Räume im Haushalt im Jahr 2014 im Vergleich zu 2009 abgenommen hat. (neue Wohnung OHNE Terasse/Balkon) -> Wobei ich diesen Wert zu "2" umkodiere, da keine negativen Werte erlaubt sind !! + +bysort hid (syear): gen diff_keller = keller - keller[_n-1] +bysort hid (syear): replace diff_keller = 2 if diff_keller == -1 +*gen diff_keller = keller - keller[_n-1] +*graph bar (count), over(diff_keller) + +bysort hid (syear): gen diff_garten = garten - garten[_n-1] +bysort hid (syear): replace diff_garten = 2 if diff_garten == -1 +*gen diff_garten = garten - garten[_n-1] +*graph bar (count), over(diff_garten) + + +bysort hid (syear): gen diff_HH_nettoeinkommen = 0 if HH_nettoeinkommen[1] == HH_nettoeinkommen[_N] & syear[1] == 2009 & syear[_N] == 2014 +bysort hid (syear): replace diff_HH_nettoeinkommen = 1 if HH_nettoeinkommen[1] != HH_nettoeinkommen[_N] & syear[1] == 2009 & syear[_N] == 2014 +tab diff_HH_nettoeinkommen +* Before "Inflationsanpassung": +* 118 households had no change in the netto_household_income over time. +* 2442 households had a change in the netto_household_income over time. + +*Question? / Reminder: +* ALLE Haushalte hatten eine monatliche Nettohaushaltseinkommen-Änderung zwischen 2009 und 2014 ! +* Is this based on my "Inflationsanpassung"? + + + +bysort hid (syear): gen diff_Quadratmeterpreis = Quadratmeterpreis - Quadratmeterpreis[_n-1] +*gen diff_Quadratmeterpreis = Quadratmeterpreis - Quadratmeterpreis[_n-1] + +sum diff_Quadratmeterpreis if diff_Quadratmeterpreis <= 0 +* 905 had 0 or even a negative change in qmp since 2009 +sum diff_Quadratmeterpreis if diff_Quadratmeterpreis > 0 +* 375 had an increase in qmp since 2009 + + + +* Generate the absolute value of the difference -> Brauche ich nicht, da schon gleich diff_ln_Quadratmeterpreis +gen log_diff_QMP = log(diff_Quadratmeterpreis) + + + +bysort hid (syear): gen diff_ln_Quadratmeterpreis = ln_Quadratmeterpreis - ln_Quadratmeterpreis[_n-1] + + + +*tab diff_Quadratmeterpreis +*graph bar (count), over(diff_Quadratmeterpreis, label(labsize(vsmall))) scale(*.6) +* xlabel(#10) +* We can see, that more people did change to a higher Quadratmeterpreis + + + +* Generiere Kategoriale Variable +* +* 0 = nicht umgezogen im Osten +* 1 = nicht umgezogen im Westen +* 2 = umgezogen innerhalb Osten +* 3 = umgezogen innerhalb Westen +* 4 = umgezogen von Westen nach Osten +* 5 = umgezogen von Osten nach Westen +* +gen umzug_cat = . +bysort hid (syear): replace umzug_cat = 0 if apartment_moved_dummy == 0 & ortschaft == 0 & ortschaft[_n-1] == 0 +bysort hid (syear): replace umzug_cat = 1 if apartment_moved_dummy == 0 & ortschaft == 1 & ortschaft[_n-1] == 1 +bysort hid (syear): replace umzug_cat = 2 if apartment_moved_dummy == 1 & ortschaft == 0 & ortschaft[_n-1] == 0 +bysort hid (syear): replace umzug_cat = 3 if apartment_moved_dummy == 1 & ortschaft == 1 & ortschaft[_n-1] == 1 +bysort hid (syear): replace umzug_cat = 4 if apartment_moved_dummy == 1 & ortschaft == 1 & ortschaft[_n-1] == 0 +bysort hid (syear): replace umzug_cat = 5 if apartment_moved_dummy == 1 & ortschaft == 0 & ortschaft[_n-1] == 1 + + + +* ################################## +* remove all other/unused variables: +* ################################## +keep hid syear miete wohnfläche HH_nettoeinkommen Quadratmeterpreis ln_Quadratmeterpreis ortschaft räume mietertyp terasse_balkon keller garten tag period region_moved_dummy apartment_moved_dummy diff_ortschaft diff_räume diff_terasse_balkon diff_keller diff_garten diff_HH_nettoeinkommen diff_Quadratmeterpreis log_diff_QMP diff_ln_Quadratmeterpreis umzug_cat + + + + + + + + +******** FINALE AUSWERTUNG - MARCEL ******** + + +* ## +* ######################## +* Model 2: West/Ost MLR: Regressionsgleichung 1) +* ######################## +* ## +regress ln_Quadratmeterpreis i.umzug_cat i.räume i.umzug_cat#i.diff_terasse_balkon i.umzug_cat#i.diff_keller i.umzug_cat#i.diff_garten diff_räume HH_nettoeinkommen wohnfläche, robust + + +estat ic +*------------------------------------------------------------------------------------------------------------------- +* Model | N log likelihood (full model) df R2 AIC BIC RMSE +*-------------+----------------------------------------------------------------------------------------------------- +* QMP_SL +*[Lin-Lin] | 1,279 -3018.99 47 0.1775 6131.98 6374.21 2.6154 +*------------------------------------------------------------------------------------------------------------------- +* ln(QMP)_SL +*[Log-Lin] | 1,279 -641.722 47 0.1476 1377.444 1619.674 0.40768 +*------------------------------------------------------------------------------------------------------------------- +* +* -> Based on these results, we prefere the Log-Lin Model !!! Better values ! + + + +outreg2 using ~/Desktop/outreg2_StadtLandWestOst.tex, tex append ctitle(ln(QMP) West/Ost) + + + + + +* ## +* ######################## +* Model 2: West/Ost MLR: Regressionsgleichung 2) +* ######################## +* ## +regress diff_ln_Quadratmeterpreis i.umzug_cat i.räume i.umzug_cat#i.diff_terasse_balkon i.umzug_cat#i.diff_keller i.umzug_cat#i.diff_garten diff_räume HH_nettoeinkommen wohnfläche, robust + + + +outreg2 using ~/Desktop/outreg2_StadtLandWestOst.tex, tex append ctitle(diff_ln(QMP) Ost/West) + + + + +*Oder mit Stefan's Variable - Ich denke aber ist doppelt log, also nein +regress log_diff_QMP i.räume i.umzug_cat i.umzug_cat#i.terasse_balkon i.umzug_cat#i.keller i.umzug_cat#i.garten i.umzug_cat#i.diff_terasse_balkon i.umzug_cat#i.diff_keller i.umzug_cat#i.diff_garten HH_nettoeinkommen wohnfläche, robust + + + +* Results - COEFPLOT: +coefplot, drop(_cons) mcolor(black) msize(0.5) xline(0) mlabposition(6) mlabsize(vsmall) mlabgap(-1.8) mlabformat("%5.3f") mlabcolor(red) ciopts(color(navy)) /// + mlabel(cond(@pval<0.01, "***", /// + cond(@pval<0.05, "**", /// + cond(@pval<0.10, "*", "")))) /// + ylabel(,labsize(1.4)) xlabel(,labsize(2)) /// + ysize(12) /// + xsize(8) /// + headings(2.räume = "{bf:Anzahl der Räume}" /// + 1.umzug_cat = "{bf:Kategorie: Umzug}" /// + 1.umzug_cat#2.terasse_balkon = "{bf:Kategorie: Umzug#Ausstattung}" /// + 1.umzug_cat#1.diff_terasse_balkon = "{bf:Kategorie: {&Delta}-Ausstattung - Umzug#Terasse/Balkon}" /// + 1.umzug_cat#1.diff_keller = "{bf:Kategorie: {&Delta}-Ausstattung - Umzug#Keller}" /// + 1.umzug_cat#1.diff_garten = "{bf:Kategorie: {&Delta}-Ausstattung - Umzug#Garten}" /// + 0.umzug_cat = "{bf:Kategorie: Umzug}" /// + diff_räume = "{bf: Weitere}",labsize(1.5)) /// + coeflabels(2.räume = "2 Zimmer Wohnung" /// + 3.räume = "3 Zimmer Wohnung" /// + 4.räume = "4 Zimmer Wohnung" /// + 5.räume = "5 Zimmer Wohnung" /// + 6.räume = "6 Zimmer Wohnung" /// + 7.räume = "7 Zimmer Wohnung" /// + 8.räume = "8 Zimmer Wohnung" /// + 9.räume = "9 Zimmer Wohnung" /// + 11.räume = "11 Zimmer Wohnung" /// + 0.umzug_cat = "Nicht umgezogen im Osten" /// + 1.umzug_cat = "Nicht umgezogen im Westen" /// + 2.umzug_cat = "Umgezogen innerhalb Osten" /// + 3.umzug_cat = "Umgezogen innerhalb Westen" /// + 4.umzug_cat = "Umgezogen von Westen nach Osten" /// + 5.umzug_cat = "Umgezogen von Osten nach Westen" /// + 0.umzug_cat#1.räume = "Osten: Nicht umgezogen - 1 Zimmer Wohnung" /// + 0.umzug_cat#2.räume = "Osten: Nicht umgezogen - 2 Zimmer Wohnung" /// + 0.umzug_cat#3.räume = "Osten: Nicht umgezogen - 3 Zimmer Wohnung" /// + 0.umzug_cat#4.räume = "Osten: Nicht umgezogen - 4 Zimmer Wohnung" /// + 0.umzug_cat#5.räume = "Osten: Nicht umgezogen - 5 Zimmer Wohnung" /// + 0.umzug_cat#6.räume = "Osten: Nicht umgezogen - 6 Zimmer Wohnung" /// + 0.umzug_cat#7.räume = "Osten: Nicht umgezogen - 7 Zimmer Wohnung" /// + 0.umzug_cat#8.räume = "Osten: Nicht umgezogen - 8 Zimmer Wohnung" /// + 0.umzug_cat#9.räume = "Osten: Nicht umgezogen - 9 Zimmer Wohnung" /// + 0.umzug_cat#11.räume = "Osten: Nicht umgezogen - 11 Zimmer Wohnung" /// + 1.umzug_cat#1.räume = "Westen: Nicht umgezogen - 1 Zimmer Wohnung" /// + 1.umzug_cat#2.räume = "Westen: Nicht umgezogen - 2 Zimmer Wohnung" /// + 1.umzug_cat#3.räume = "Westen: Nicht umgezogen - 3 Zimmer Wohnung" /// + 1.umzug_cat#4.räume = "Westen: Nicht umgezogen - 4 Zimmer Wohnung" /// + 1.umzug_cat#5.räume = "Westen: Nicht umgezogen - 5 Zimmer Wohnung" /// + 1.umzug_cat#6.räume = "Westen: Nicht umgezogen - 6 Zimmer Wohnung" /// + 1.umzug_cat#7.räume = "Westen: Nicht umgezogen - 7 Zimmer Wohnung" /// + 1.umzug_cat#8.räume = "Westen: Nicht umgezogen - 8 Zimmer Wohnung" /// + 1.umzug_cat#9.räume = "Westen: Nicht umgezogen - 9 Zimmer Wohnung" /// + 1.umzug_cat#11.räume = "Westen: Nicht umgezogen - 11 Zimmer Wohnung" /// + 2.umzug_cat#1.räume = "Osten: innerhalb umgezogen - 1 Zimmer Wohnung" /// + 2.umzug_cat#2.räume = "Osten: innerhalb umgezogen - 2 Zimmer Wohnung" /// + 2.umzug_cat#3.räume = "Osten: innerhalb umgezogen - 3 Zimmer Wohnung" /// + 2.umzug_cat#4.räume = "Osten: innerhalb umgezogen - 4 Zimmer Wohnung" /// + 2.umzug_cat#5.räume = "Osten: innerhalb umgezogen - 5 Zimmer Wohnung" /// + 2.umzug_cat#6.räume = "Osten: innerhalb umgezogen - 6 Zimmer Wohnung" /// + 2.umzug_cat#7.räume = "Osten: innerhalb umgezogen - 7 Zimmer Wohnung" /// + 2.umzug_cat#8.räume = "Osten: innerhalb umgezogen - 8 Zimmer Wohnung" /// + 2.umzug_cat#9.räume = "Osten: innerhalb umgezogen - 9 Zimmer Wohnung" /// + 2.umzug_cat#11.räume = "Osten: innerhalb umgezogen - 11 Zimmer Wohnung" /// + 3.umzug_cat#1.räume = "Westen: innerhalb umgezogen - 1 Zimmer Wohnung" /// + 3.umzug_cat#2.räume = "Westen: innerhalb umgezogen - 2 Zimmer Wohnung" /// + 3.umzug_cat#3.räume = "Westen: innerhalb umgezogen - 3 Zimmer Wohnung" /// + 3.umzug_cat#4.räume = "Westen: innerhalb umgezogen - 4 Zimmer Wohnung" /// + 3.umzug_cat#9.räume = "Westen: innerhalb umgezogen - 9 Zimmer Wohnung" /// + 3.umzug_cat#11.räume = "Westen: innerhalb umgezogen - 11 Zimmer Wohnung" /// + 4.umzug_cat#1.räume = "Von Westen nach Osten gezogen - 1 Zimmer Wohnung" /// + 4.umzug_cat#2.räume = "Von Westen nach Osten gezogen - 2 Zimmer Wohnung" /// + 4.umzug_cat#3.räume = "Von Westen nach Osten gezogen - 3 Zimmer Wohnung" /// + 4.umzug_cat#4.räume = "Von Westen nach Osten gezogen - 4 Zimmer Wohnung" /// + 4.umzug_cat#5.räume = "Von Westen nach Osten gezogen - 5 Zimmer Wohnung" /// + 4.umzug_cat#6.räume = "Von Westen nach Osten gezogen - 6 Zimmer Wohnung" /// + 4.umzug_cat#7.räume = "Von Westen nach Osten gezogen - 7 Zimmer Wohnung" /// + 4.umzug_cat#8.räume = "Von Westen nach Osten gezogen - 8 Zimmer Wohnung" /// + 4.umzug_cat#9.räume = "Von Westen nach Osten gezogen - 9 Zimmer Wohnung" /// + 4.umzug_cat#11.räume = "Von Westen nach Osten gezogen - 11 Zimmer Wohnung" /// + 5.umzug_cat#1.räume = "Vom Osten in die Westen gezogen - 1 Zimmer Wohnung" /// + 5.umzug_cat#2.räume = "Vom Osten in die Westen gezogen - 2 Zimmer Wohnung" /// + 5.umzug_cat#3.räume = "Vom Osten in die Westen gezogen - 3 Zimmer Wohnung" /// + 5.umzug_cat#4.räume = "Vom Osten in die Westen gezogen - 4 Zimmer Wohnung" /// + 5.umzug_cat#5.räume = "Vom Osten in die Westen gezogen - 5 Zimmer Wohnung" /// + 5.umzug_cat#6.räume = "Vom Osten in die Westen gezogen - 6 Zimmer Wohnung" /// + 5.umzug_cat#7.räume = "Vom Osten in die Westen gezogen - 7 Zimmer Wohnung" /// + 5.umzug_cat#8.räume = "Vom Osten in die Westen gezogen - 8 Zimmer Wohnung" /// + 5.umzug_cat#9.räume = "Vom Osten in die Westen gezogen - 9 Zimmer Wohnung" /// + 5.umzug_cat#11.räume = "Vom Osten in die Westen gezogen - 11 Zimmer Wohnung" /// + 0.umzug_cat#1.terasse_balkon = "Osten: Nicht umgezogen - mit Terasse/Balkon" /// + 0.umzug_cat#2.terasse_balkon = "Osten: Nicht umgezogen - ohne Terasse/Balkon" /// + 1.umzug_cat#1.terasse_balkon = "Westen: Nicht umgezogen - mit Terasse/Balkon" /// + 1.umzug_cat#2.terasse_balkon = "Westen: Nicht umgezogen - ohne Terasse/Balkon" /// + 2.umzug_cat#1.terasse_balkon = "Osten: innerhalb umgezogen - mit Terasse/Balkon" /// + 2.umzug_cat#2.terasse_balkon = "Osten: innerhalb umgezogen - ohne Terasse/Balkon" /// + 3.umzug_cat#1.terasse_balkon = "Westen: innerhalb umgezogen - mit Terasse/Balkon" /// + 3.umzug_cat#2.terasse_balkon = "Westen: innerhalb umgezogen - ohne Terasse/Balkon" /// + 4.umzug_cat#1.terasse_balkon = "Von Westen nach Osten gezogen - mit Terasse/Balkon" /// + 4.umzug_cat#2.terasse_balkon = "Von Westen nach Osten gezogen - ohne Terasse/Balkon" /// + 5.umzug_cat#1.terasse_balkon = "Vom Osten in die Westen gezogen - mit Terasse/Balkon" /// + 5.umzug_cat#2.terasse_balkon = "Vom Osten in die Westen gezogen - ohne Terasse/Balkon" /// + 0.umzug_cat#1.keller = "Osten: Nicht umgezogen - mit Keller" /// + 0.umzug_cat#2.keller = "Osten: Nicht umgezogen - ohne Keller" /// + 1.umzug_cat#1.keller = "Westen: Nicht umgezogen - mit Keller" /// + 1.umzug_cat#2.keller = "Westen: Nicht umgezogen - ohne Keller" /// + 2.umzug_cat#1.keller = "Osten: innerhalb umgezogen - mit Keller" /// + 2.umzug_cat#2.keller = "Osten: innerhalb umgezogen - ohne Keller" /// + 3.umzug_cat#1.keller = "Westen: innerhalb umgezogen - mit Keller" /// + 3.umzug_cat#2.keller = "Westen: innerhalb umgezogen - ohne Keller" /// + 4.umzug_cat#1.keller = "Von Westen nach Osten gezogen - mit Keller" /// + 4.umzug_cat#2.keller = "Von Westen nach Osten gezogen - ohne Keller" /// + 5.umzug_cat#1.keller = "Vom Osten in die Westen gezogen - mit Keller" /// + 5.umzug_cat#2.keller = "Vom Osten in die Westen gezogen - ohne Keller" /// + 0.umzug_cat#1.garten = "Osten: Nicht umgezogen - mit Garten" /// + 0.umzug_cat#2.garten = "Osten: Nicht umgezogen - ohne Garten" /// + 1.umzug_cat#1.garten = "Westen: Nicht umgezogen - mit Garten" /// + 1.umzug_cat#2.garten = "Westen: Nicht umgezogen - ohne Garten" /// + 2.umzug_cat#1.garten = "Osten: innerhalb umgezogen - mit Garten" /// + 2.umzug_cat#2.garten = "Osten: innerhalb umgezogen - ohne Garten" /// + 3.umzug_cat#1.garten = "Westen: innerhalb umgezogen - mit Garten" /// + 3.umzug_cat#2.garten = "Westen: innerhalb umgezogen - ohne Garten" /// + 4.umzug_cat#1.garten = "Von Westen nach Osten gezogen - mit Garten" /// + 4.umzug_cat#2.garten = "Von Westen nach Osten gezogen - ohne Garten" /// + 5.umzug_cat#1.garten = "Vom Osten in die Westen gezogen - mit Garten" /// + 5.umzug_cat#2.garten = "Vom Osten in die Westen gezogen - ohne Garten" /// + 1.umzug_cat#1.diff_terasse_balkon = "Westen: Nicht umgezogen - neu mit Terasse/Balkon" /// + 1.umzug_cat#2.diff_terasse_balkon = "Westen: Nicht umgezogen - neu ohne Terasse/Balkon" /// + 2.umzug_cat#1.diff_terasse_balkon = "Osten: innerhalb umgezogen - neu mit Terasse/Balkon" /// + 2.umzug_cat#2.diff_terasse_balkon = "Osten: innerhalb umgezogen - neu ohne Terasse/Balkon" /// + 3.umzug_cat#1.diff_terasse_balkon = "Westen: innerhalb umgezogen - neu mit Terasse/Balkon" /// + 3.umzug_cat#2.diff_terasse_balkon = "Westen: innerhalb umgezogen - neu ohne Terasse/Balkon" /// + 4.umzug_cat#1.diff_terasse_balkon = "Von Westen nach Osten gezogen - neu mit Terasse/Balkon" /// + 4.umzug_cat#2.diff_terasse_balkon = "Von Westen nach Osten gezogen - neu ohne Terasse/Balkon" /// + 5.umzug_cat#1.diff_terasse_balkon = "Vom Osten in die Westen gezogen - neu mit Terasse/Balkon" /// + 5.umzug_cat#2.diff_terasse_balkon = "Vom Osten in die Westen gezogen - neu ohne Terasse/Balkon" /// + 1.umzug_cat#1.diff_keller = "Westen: Nicht umgezogen - neu mit Keller" /// + 1.umzug_cat#2.diff_keller = "Westen: Nicht umgezogen - neu ohne Keller" /// + 2.umzug_cat#1.diff_keller = "Osten: innerhalb umgezogen - neu mit Keller" /// + 2.umzug_cat#2.diff_keller = "Osten: innerhalb umgezogen - neu ohne Keller" /// + 3.umzug_cat#1.diff_keller = "Westen: innerhalb umgezogen - neu mit Keller" /// + 3.umzug_cat#2.diff_keller = "Westen: innerhalb umgezogen - neu ohne Keller" /// + 4.umzug_cat#1.diff_keller = "Von Westen nach Osten gezogen - neu mit Keller" /// + 4.umzug_cat#2.diff_keller = "Von Westen nach Osten gezogen - neu ohne Keller" /// + 5.umzug_cat#1.diff_keller = "Vom Osten in die Westen gezogen - neu mit Keller" /// + 5.umzug_cat#2.diff_keller = "Vom Osten in die Westen gezogen - neu ohne Keller" /// + 1.umzug_cat#1.diff_garten = "Westen: Nicht umgezogen - neu mit Garten" /// + 1.umzug_cat#2.diff_garten = "Westen: Nicht umgezogen - neu ohne Garten" /// + 2.umzug_cat#1.diff_garten = "Osten: innerhalb umgezogen - neu mit Garten" /// + 2.umzug_cat#2.diff_garten = "Osten: innerhalb umgezogen - neu ohne Garten" /// + 3.umzug_cat#1.diff_garten = "Westen: innerhalb umgezogen - neu mit Garten" /// + 3.umzug_cat#2.diff_garten = "Westen: innerhalb umgezogen - neu ohne Garten" /// + 4.umzug_cat#1.diff_garten = "Von Westen nach Osten gezogen - neu mit Garten" /// + 4.umzug_cat#2.diff_garten = "Von Westen nach Osten gezogen - neu ohne Garten" /// + 5.umzug_cat#1.diff_garten = "Vom Osten in die Westen gezogen - neu mit Garten" /// + 5.umzug_cat#2.diff_garten = "Vom Osten in die Westen gezogen - neu ohne Garten" /// + diff_räume = "{&Delta} Anzahl der Räume" /// + diff_terasse_balkon = "{&Delta} Terasse/Balkon" /// + diff_keller = "{&Delta} Keller" /// + diff_garten = "{&Delta} Garten" /// + HH_nettoeinkommen = "Nettohaushaltseinkommen" /// + wohnfläche = "Wohnfläche") + +* mlabel(cond(@pval<.001, "***", /// +* cond(@pval<.01, "**", /// +* cond(@pval<.05, "*", "")))) /// + + +* If I want to see the omitted factor levels: +*omitted baselevels + + +******************* DESCRIPTIVE STATISTICS TABLE !!! ***************************** +summarize Quadratmeterpreis miete wohnfläche i.ortschaft i.räume i.terasse_balkon i.keller i.garten HH_nettoeinkommen +********************************************************************************** +asdoc sum Quadratmeterpreis miete wohnfläche ortschaft räume terasse_balkon keller garten HH_nettoeinkommen, stat(N mean sd min p25 p75 max) replace + +*Tables of factor variables: +tab1 ortschaft räume terasse_balkon keller garten + + + +*** PLOT Corr: +graph matrix ln_Quadratmeterpreis miete wohnfläche ortschaft räume terasse_balkon keller garten HH_nettoeinkommen, half xla(, ang(90)) plotregion(margin(medium)) + +* OR in numbers!!!!: +pwcorr ln_Quadratmeterpreis miete wohnfläche ortschaft räume terasse_balkon keller garten HH_nettoeinkommen, sig + + + + +su +* ##### +* Note: Mein Panel Datensatz besitzt nun 1280 verschiedene Haushalte (bei zwei Jahren also: n=2560) +* ##### + + +* Save the resulting dataset +* save "/home/marcel/Desktop/West_Ost_panneldata.dta", replace + + + + +****************************** EXTRA NOTES AND TEST - for curiosity: *********** +******************************************************************************** + + +* Perform pairwise comparisons with Tukey correction +*pwcompare ln_Quadratmeterpreis, by(räume) mcompare(tukey) + +*corr-plot: +graph matrix ln_Quadratmeterpreis Quadratmeterpreis wohnfläche HH_nettoeinkommen ortschaft move_dummy räume terasse_balkon keller garten, half xla(, ang(90)) plotregion(margin(medium)) + +*corr-output: +pwcorr ln_Quadratmeterpreis Quadratmeterpreis wohnfläche HH_nettoeinkommen ortschaft move_dummy räume terasse_balkon keller garten, sig + +*VIF: +estat vif + + + + + +************ +************ +* Ansatz: Termin - Absprachen mit Stefan: +************ +*Regressionsgleichung 1.1) +regress diff_Quadratmeterpreis i.ortschaft i.apartment_moved_dummy diff_räume diff_terasse_balkon diff_keller diff_garten HH_nettoeinkommen wohnfläche, robust + +*Regressionsgleichung 1.2) +regress log_diff_QMP i.ortschaft i.apartment_moved_dummy diff_räume i.diff_terasse_balkon i.diff_keller i.diff_garten HH_nettoeinkommen wohnfläche, robust +************ + + +*log the results to a text file +*log using "/home/marcel/Desktop/ln_Quadratmeterpreis_OW_Modell.txt", text replace + +*so the output just keeps going +*set more off + diff --git a/Empirisches Seminar: Regionale Unterschiede in der Mietpreisentwicklung/Modell-2_regionaler_West_Ost_Vergleich.dta b/Empirisches Seminar: Regionale Unterschiede in der Mietpreisentwicklung/Modell-2_regionaler_West_Ost_Vergleich.dta new file mode 100644 index 0000000..b89316f Binary files /dev/null and b/Empirisches Seminar: Regionale Unterschiede in der Mietpreisentwicklung/Modell-2_regionaler_West_Ost_Vergleich.dta differ