Agrar- und Ernährungspolitik III Vorlesung 11. März 2009 Statistik und Modellierung auf Grundlage einzelbetrieblicher Daten Martin Kniepert
Übersicht Bild von der Landwirtschaft Agrarregister und Strukturerhebung Auswahlrahmen Hintergrund: Standarddeckungsbeitrag (SDB) Stichprobenbestimmung (Streuungsplan) Auswahl von Ergebnissen Buchführungsergebnisse Auswahlrahmen, Streuungsplan
Zur Berechnung von Einkommen in der Agrarwirtschaft Marktorientierte Ansätze insbesondere die LGR (=> spätere Vorlesung) Unmittelbar betriebsorientierte Ansätze – Auswertung von Buchhaltungsergebnissen landwirtschaftlicher Betriebe Problem: Die Betriebe können nicht insgesamt erhoben werden. Lösung: Stichprobenerhebung aus der Grundgesamtheit Wann sprechen wir von einem Modell? Abstraktion (Diskussion)
Agrarregister Registrierung aller land- und forstwirtschaftlichen Betriebe mit Sitz in Österreich Stammdaten Betriebsnummer, Adresse, Name Bewirtschafterin Erhebungsspezifische Daten Eckdaten Fläche Eckdaten Nutztierbestand … Standarddeckungsbeitrag (SDB) Wird aufgrund von Informationen aus Primärerhebungen und verschiedenen Verwaltungsdaten laufend aktualisiert (2007: 232.516 Betriebe http://www.statistik.gv.at/web_de/statistiken/land_und_forstwirtschaft/agrarregister/index.html
Deckungsbeitrag Deckungsbeitrag als Begriff der betrieblichen Kosten- und Leistungs- bzw. Planungsrechnung Deckungsbeitrag = Erlös – variable Kosten Steht zur Deckung der Fixkosten zur Verfügung Mehrstufe Deckungsbeitragsrechnung erlaubt dem Unternehmen unterschiedliche Preissetzungen je nach Fristigkeit (vgl. bspw. last-Minute Angebote) Deckungsbeitragskatalog Informationsquelle zur Betriebsplanung bzw. -beratung Betriebsauswertungen und Experteneinschätzungen Verwendung in betrieblichen und regionalen Optimierungsmodellen vgl. Katalog für Österreich oder auch web-basiert von der LfL (Bayern)
Standard-Deckungsbeitrag Bewertung von Erlösung und variablen Kosten zu „standardisierten Geldwerten“ auf Ebene einzelner Aktivitäten (xi): bspw. Mahlweizen (Feuchtgebiet) Kalbinnenaufzucht etc. Gesamt-Standard-Deckungsbeitrag (GSDB) eines Betriebes Der GSDB dient der ökonomische Bewertung von Betrieben in der AS
Strukturerhebungen (1) Betriebliche Erhebungen Die Agrarstrukturerhebung (AS, als Vollerhebung: 1995, 1999, 2010, als Stichprobe 2003, 2005, 2007, 2013, 2016; für AT) Anbau auf dem Ackerland (jährlich; dient auch als Grundlage für die Agrarstrukturerhebung) Weingartenerhebung Etc. http://www.statistik.gv.at/web_de/statistiken/land_und_forstwirtschaft/agrarstruktur_flaechen_ertraege/index.html In der Umsetzung enge Verzahnung verschiedener Sekundärdaten (insbesondere aus Mehrfachantrag der AMA; Verwendung in der AS als sekundäre Verwendung) mit Primärdaten der AS
Strukturerhebungen (2) Erfassungsuntergrenzen unterschiedlich nach Jahren, Betriebsformen etc. Bspw. AS 1995: 1 ha Gesamtfläche; Bspw. AS 1999: 1 ha landwirtschaftliche genutzte Fläche etc. Veränderte Erhebungsmethoden Viehzählung über die Gemeinden => Rinderdatenbank (seit… Geflügelzählung über Gemeinden => QGV Jeweils Vergleichbarkeit von Daten überprüfen!
Exkurs: Interessens-Hintergründe Daten werden in aller Regel nicht aus wissenschaftlichem Interesse erhoben. Motive waren oder sind: Steuereinnahmen Rekrutierung von Soldaten Zolleinnahmen (=> Außenhandelsstatistik; EU: MWSt) Etc. Erhebung entspricht oft nicht theoretischen Anforderungen Auswahl von Fragestellungen ist implizit interessensgleitet
Voll- und Einzelerhebungen Vollerhebungen (census) sind aufwändig Vollerhebung erheblich teurer Verzögerung der Ergebnisse durch Vollständigkeitsanspruch Genügen nicht öfter mal Stichproben (sample surveys)? Frage der Homogenität des Grundgesamtheit Eng damit verwandt: Frage der „Stichhaltigkeit“ der Stichprobe, gemessen durch Konfidenzintervalle (vgl. hierzu nächste Vorlesung.)
Auswahlrahmen und Schichten Die Grundgesamtheit der statistisch zu untersuchenden Betriebe umfasst nach Betriebsregister 232.516 Betriebe Die Stichprobenerhebung für AS 2007 umfasste 39.999 Betriebe Homogenität der Grundgesamtheit erlaubt Verkleinerung Schichtung der Grundgesamtheit (=> auch „Streungsplan) Untergruppen lassen sich definieren, die unterschiedlich homogen sind deshalb mehr oder weniger große Stichproben brauchen (8 bis 16 Schichten je Bundesland) Bestimmung der Schichten nach Kriterien (letztlich nach Betriebsformen) http://www.statistik.gv.at/web_de/statistiken/land_und_forstwirtschaft/agrarstruktur_flaechen_ertraege/dokumentationen.html => Agrarstrukturerhebung 2007
Stichprobenfehler der AS 2007 in % (bei 95% statistischer Sicherheit); entspricht in etwa dem zweifachen Standardfehler Quelle: http://www.statistik.gv.at/web_de/statistiken/land_und_forstwirtschaft/agrarstruktur_flaechen_ertraege/dokumentationen.html Dort weitere Angaben zu Arbeitskräften, Pferde, Rinder, Schweine, Schafe, Ziegen, Hühner
Hochrechnung (AS) Hochrechnung für eine geschichtete Stichprobe Wobei xbhj (b) Bundesland – (h) Betriebsform j=1..n Betrieb j aus dem Stichprobenumfang n von bh Nbh Anzahl der Betriebe im Auswahlrahmen von bh X Schätzwert
Ausgewählte Ergebnisse Quelle: http://www.statistik.gv.at/web_de/statistiken/land_und_forstwirtschaft/agrarstruktur_flaechen_ertraege/betriebsstruktur/index.html
Publikation von Ergebnissen Vgl. http://www.statistik.gv.at/web_de/statistiken/land_und_forstwirtschaft/agrarstruktur_flaechen_ertraege/index.html Dort bspw. http://www.statistik.gv.at/web_de/statistiken/land_und_forstwirtschaft/agrarstruktur_flaechen_ertraege/betriebsstruktur/index.html Dort: Tabellen Dort: Gesamtberichte unter „Weitere Informationen“ (Umfasst Text und Tabellenteil) Publikationspflichtig (Internet, gedruckt) sind bestimmte, per Verordnung gegebene Aggregate Einzelbetriebliche Daten werden – wenn überhaupt – nur zu Forschungszwecken und anonymisiert weitergegeben.
Die Vorlesung bis hierher: Agrarstrukturerhebung als Rückgrat der Agrarstatistik Umfangreiche Primärdaten (eigene Erhebung) Einbeziehung weiterer Informationen aus anderen Datenbeständen als Sekundärdaten unter Wahrung der Kohärenz Zeitliche und EU-weite Vergleichbarkeit der Ergebnisse Statistische Fehler je nach Aggregat unterschiedlich Aber: Keine ökonomischen Größen außer dem Standarddeckungsbeitrag (SDB) Stichprobe auf Basis der Buchhaltung als Möglichkeit!
Das INLB (1) Das Informationsnetz Landwirtschaftlicher Buchführung (INLB; engl.: FADN, frz.: RICA) Basierend auf EU-Verordnungen http://europa.eu.int/comm/agriculture/rica/index_de.cfm Weiter zu Rechtsgrundlagen... INLB: „ ... die einzige Quelle mikroökonomischer Daten (..), die harmonisiert sind, d. h. die Buchhaltungsgrundsätze sind in allen Ländern gleich.“ Wesentlicher Bestandteil des „Grünen Berichts“ des Bundesministeriums Erhebungen seit den 1930er Jahren, allerdings nicht explizit auf Zeitreihen abgestellt. RI/CC 882 Rev.7.0 http://www.lbg.at/257_DE => Leistungen => Agrarstatistik
Das INLB (2) Das INLB basiert – wie bereits die AS – auf einer geschichteten Stichprobe Der „Streungsplan“ (also Art und Größe der Schichten) werden auf Grundlage der AS festglegt. Die Auswahl der Betriebe erfolgt nicht ausschließlich nach dem Zufallsprinzip, sondern gezielt nach ausgewählten Kriterien. [Berücksichtigt werden für Österreich übrigens bestimmte Aspekte, die für die EU insgesamt weniger wichtig sind; streng genommen ist das INLB eine Sonderauswertung der österreichischen Ergebnisse der lw. Buchführung.]
Der Auswahlrahmen in Österreich (1) 6.000 € > StDB > 150.000 € Betriebe > 200 ha Wald bleiben ausgeschlossen Betriebe mit > 25% Gartenbauanteil bleiben ausgeschlossen => Konzentrationsprinzip (vgl. Kromrey 1994:203) Nach GB 2004 Auswahl-rahmen Bäuerlich Betriebe insg. % Bäuerliche Betriebe Betriebe insgesamt Anzahl 112.435 207.487 54 217.508 Fläche (ha) 2.063.800 2.431.857 85 2.580.905 ... GVE 414.600 450.808 92 471.674 GSDB 2.566.942 3.101.902 83 3.518.322 Quelle: LBG Buchführungsergebnisse 2007, Teil B, AS 2005, Grüner Bericht 2004
Der Auswahlrahmen in Österreich (2) Kleinstbetriebe Großbetriebe Auswahlrahmen Buchführungsergebnisse Gartenbau, große Forstbetriebe
Streuungsplan der lw. Buchführung 28 „Schichten“ (vormals 70; vgl. Tab. A2, LBG 2001) Disproportional geschichtet (Hochrechnung mit Gewichten für einzelnen Schichten) Jede Schicht in der Stichprobe wird als repräsentativ für die entsprechende Schicht in der Grundgesamtheit zusammengestellt Die einzelnen Schichten (S) werden gewichtet, um auch für den Auswahlrahmen insgesamt repräsentativ zu sein Bezugsgröße: Familienarbeitskräfte, ha RLN, Größen die in der Stichprobe und in der Grundgesamtheit vorliegen.
Kriterien für den Streuungsplan (1) Schichten nach Größenklassen und Betriebsform 4 Größenklassen (6-12 tsd. ... 90-150 tsd. € SDB; bis 2002: 8 Größenklassen) 7 Betriebsform (Futterbau, Marktfrucht, Veredelung, etc.) Bis 2002: Gebiet explizit im Streuungsplan alpine Lagen mittlere Höhenlagen Flach- und Hügelland zusätzlich und genauer für Österreich: Erschwerniszonen, Höhe, Hangneigung) Vereinfachung des Streuungsplanes von 70 auf 28 Schichten seit 2002
Kriterien für den Streuungsplan (2) Betriebsformen des INLB im Einzelnen Betriebe mit hohem Forstanteil (>50%) Betriebe mit 25 bis 50% Forstanteil Futterbaubetriebe (Milchkühe, sonst. Rinder, Schafe, Ziegen, Pferde u.a.) Landwirtschaftliche Mischbetriebe Marktfruchtbetriebe (Getreide, Zuckerrüben, Erdäpfel, Ölfrüchte, Alternativen, Tabak, sonst. marktfähige Produkte) Dauerkulturen (Obst- und Weinbau) Veredelung (Schweine, Geflügel)
Kriterien für den Streuungsplan (3) Quelle: Bundesanstalt für Agrarwirtschaft, AS 2005, zitiert nach LBG Buchführungsergebnisse 2007, Teil B
„repräsentative“ Stichprobe? Eingrenzung des Auswahlrahmens (Groß-, Kleinstbetriebe, Gartenbau) Mindestens 2.200 Betriebe entsprechen 1,96 % der Gesamtzahl des Auswahlrahmens (217.508) Deutlich weniger als in der Agrarstrukturerhebung Auswahl für Schichtungsplan widerspricht dem theoretisch erforderlichen Zufallsprinzip Mögliche Verzerrung durch höheren Anteil betriebswirtschaftlich orientierter Landwirte (Buchhaltung ist bereits ein Auswahlkriterium)
Gewichtung/Hochrechnung (INLB) Durch die LBG werden in der Regel nur Merkmale „je ha Landnutzungsfläche“ oder „je Arbeitskraft“ (also Durchschnittswerte, keine Österreich-Flächen (bspw.) Wenn, dann werden alle Größen über die „je-Fläche Auswertung“ hochgerechnet Vorteil: Leichter zu rechnen, Kohärenz über den gesamten Datensatz Möglichkeit der Hochrechnung über jeweils spezifische für die Fragestellung, den Betriebsschwerpunkt besser geeignete Größe bleibt ungenutzt.
Ergebnisse des INLB Publikation bestimmter im Rahmen des „Grünen Berichts“ Weiter detaillierte Publikation durch LBG (www.lbg.at) Einzelbetriebliche Daten werden – wenn überhaupt – wiederum nur anonymisiert und für spezielle Forschungsprojekte freigegeben
Ausgewählte Ergebnisse des INLB (1) … Quelle: www.lbg.at
Ausgewählte Ergebnisse des INLB (2) … Quelle: www.lbg.at
Lese- und Lernempfehlungen Zu Signifikanztests, Konfidenzintervall etc. Sachs, Lothar (1999), Angewandte Statistik, Neunte Überarbeitete Auflage, Berlin, Heidelberg [Lehrbuchsammlung der BOKU 32.60. 1 9A, insb. S. 97ff) Bortz, J., Döring, N. (1995), Forschungsmethoden und Evaluation, 2. Auflage, Berlin et al. ([Lehrbuchsammlung der BOKU 20.60 1 2A, insbes. Seite 368 -399] Erben, Wilhelm (1998), Statistik mit Excel 5 oder 7, (Buch mit Diskette), [Lehrbuchsammlung der BOKU 32.60 5] Zur den Buchaltungsdaten LBG-Wirtschaftstreuhand, Buchführungsergebnisse aus der österreichischen Landwirtschaft (jährlich), Wien BMLFUW (Hg), Grüner Bericht (jährlich, Wien) (www.gruenerbericht.at) Diverse Internet-Angebote unter Stichworten wie „Konfidenzintervall“, „Standardfehler“ etc. mit Java-Applets zur Manipulation von Parametern etc.
Ausblick
Flächen einer Normalverteilung N(μ,σ) y 0,4 0,3 0,2 0,1 -z z μ-4σ μ-3σ μ-2σ μ-σ μ μ+σ μ+2σ μ+3σ μ+4σ 68,27% 95,45% 99,73% 99,99%
Standardnormalverteilung N(0,1) Jede beliebige Normalverteilung N(μ,σ) kann durch Standardisierung in eine einheitliche Standardnormalverteilung N(0,1) transformiert (d.h. mit z multipliziert) werden. Für N(0,1) sind Flächenanteile (also Wahrscheinlich-keiten) „austabelliert“.
Flächen einer Standard-Normalverteilung N(0,1) y 0,4 0,3 0,2 0,1 -z z -4 -3 -2 -1 1 2 3 4 68,27% 95,45% 99,73% 99,99%
Konfidenzintervall Das Konfidenzintervall (Δkrit) für Mittelwerte (μ) berechnet sich folgendermaßen: Für n > 30 kann diese Formel genutzt werden:
T-Verteilungen (df =1, 3, 5, 10) Vgl. http://www.uni-kiel.de/medinfo/biometrie/folien/ss08_2003/sld012.htm
t-Verteilung df p 0,900 p 0,975 p 0,990 p 0,995 1 3,078 12,706 31,821 63,656 2 1,886 4,303 6,965 9,925 3 1,638 3,182 4,541 5,841 4 1,533 2,776 3,747 4,604 ... 10 1,372 2,228 2,764 3,169 30 1,310 2,042 2,457 2,750 1000 1,282 1,962 2,330 2,581
Zur Hypothesenbildung Nullhypothese H0: Ein Zusammenhang zwischen zwei untersuchten Größen besteht nicht! Alternativhypothese H1: In der Regel die Forschungshypothese Ein Zusammenhang zwischen zwei untersuchten größen wird unterstell bzw. soll nachgewiesen werden.
Zur Hypothesenbildung (1) Nullhypothese H0: Ein Zusammenhang zwischen zwei untersuchten Größen besteht nicht! (bspw. Steuer auf Inputverbrauch) Ein Grenzwert wird nicht überschritten, höchstens erreicht Alternativhypothese H1: In der Regel die Forschungshypothese Ein Zusammenhang zwischen zwei untersuchten Größen wird unterstellt, soll nachgewiesen werden. Ein Grenzwert wird überschritten
Zur Hypothesenbildung (2) Nullhypothese H0 und Alternativhypothese H1 schließen sich gegenseitig aus. Bspw. H0: Pestizidbelastung <= 3 g je / kg H1 : Pestizidbelastung > 3 g je / kg Eine dritte Möglichkeit neben diesen Hypothesen bleiben nicht. Im Beispiel (3 g je / kg ) wird eine Annahmegrenze (cA) präzisiert. Der kritische Wert (c) beläuft sich auf 3 g bei einem Stichprobenumfang von 1 kg.
Begriffe Im Beispiel (3 g je / kg ) wird eine Annahmegrenze (cA) präzisiert. Der kritische Wert (c) beläuft sich auf 3 g bei einem Stichprobenumfang von 1 kg. Signifikanzniveau α0:
Bestätigung? Fehler 1. und 2. Art Wenn eine Hypothese bestätigt werden kann, gilt die andere automatisch als verworfen. Eine dritte Möglichkeit neben diesen Hypothesen bleiben nicht. Fehler 1. Art: H0 wird verworfen, obwohl H0 richtig ist. Fehler 2. Art: H0 wird angenommen, obwohl H0 falsch ist. In beiden Fällen erweist sich die Stichprobe als gewissermaßen nicht stichhaltig.
Beispiel Pestizid Nullhypothese H0 und Alternativhypothese H1 schließen sich gegenseitig aus. Bspw. H0: Pestizidbelastung <= 3 g je / kg H1 : Pestizidbelastung > 3 g je / kg Eine dritte Möglichkeit neben diesen Hypothesen bleiben nicht.