1 Paul Bennett, Martin Durrell, Silke Scheible, Jason Whitt The GerManC Project A Representative Corpus of Early Modern German (1650-1800)

Slides:



Advertisements
Ähnliche Präsentationen
Cadastre for the 21st Century – The German Way
Advertisements

PRESENTATION HEADLINE
Vernetzung von Repositorien : DRIVER Guidelines Dr Dale Peters, SUB Goettingen 4. Helmholtz Open Access Workshop Potsdam, 17 Juni 2008.
Finding the Pattern You Need: The Design Pattern Intent Ontology
SION Vacuum Circuit-Breakers 3AE5 and 3AE1
Themenportal Europäische Geschichte / Web portal European History
H - A - M - L - E - IC T Teachers Acting Patterns while Teaching with New Media in the Subjects German, Mathematics and Computer Science Prof. S. Blömeke,
Mean and variance.
Managing the Transition from School-to-Work Empirical Findings from a Mentoring Programme in Germany Prof. i.V. Dr. Martin Lang.
1 | R. Steinbrecher | IMK-IFU | KIT – die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH) Natural Sources SNAP11.
First Seminar in Brussels, 15th of December 2010
Steinbeis Forschungsinstitut für solare und zukunftsfähige thermische Energiesysteme Nobelstr. 15 D Stuttgart WP 4 Developing SEC.
Fakultät für informatik informatik 12 technische universität dortmund Specifications Peter Marwedel TU Dortmund, Informatik 12 Graphics: © Alexandra Nolte,
Choose 5-7 adjectives to create the following comparative/superlativ e slideshow. You may choose words not on our list but you MUST make sure to use them.
Institut für Verkehrsführung und Fahrzeugsteuerung > Technologien aus Luft- und Raumfahrt für Straße und Schiene Automatic Maneuver Recognition in the.
Institut für Verkehrsführung und Fahrzeugsteuerung > Technologien aus Luft- und Raumfahrt für Straße und Schiene Driving Manoeuvre Recognition > 19. Januar.
Hochschulteam der Agentur für Arbeit Trier Preventing the Brainware Crisis Workshop Schloss Dagstuhl Student Enrollment in Computer Science.
Introduction to the topic. Goals: Improving the students essay style in general Finding special words and expressions that can be used in essay writing.
Bologna conference: Asymmetric Mobility Medical sciences in Austria Christian SEISER 29 May 2008.
Fachabteilung 16A Überörtliche Raumplanung Cross border co-operation from the view of a public administration unit.
Deutsche Gesellschaft für Technische Zusammenarbeit GmbH Integrated Experts as interface between technical cooperation and the private sector – An Example.
Methods Fuzzy- Logic enables the modeling of rule based knowledge by the use of fuzzy criteria instead of exact measurement values or threshold values.
Die Hausaufgaben: Machen Sie Ü. 7 auf S. 29
Adjektive Endungen von Frau Templeton.
Medical Universities‘ Teaching Staff Training in Bochum Germany
Machen Sie sich schlau am Beispiel Schizophrenie.
die Zeiten (The Tenses) das Aktiv (Active Voice)
How many more nouns can you think of?
Institut AIFB, Universität Karlsruhe (TH) Forschungsuniversität gegründet 1825 Towards Automatic Composition of Processes based on Semantic.
| DC-IAP/SVC3 | © Bosch Rexroth Pneumatics GmbH This document, as well as the data, specifications and other information set forth in.
Das Perfekt (Present Perfect Tense). Think of 5 things you did in your holidays but think of sentences in the PRESENT TENSE. 1.Am Montag schlafe ich viel.
A good view into the future Presented by Walter Henke BRIT/SLL Schweinfurt, 14. November 2006.
Adjective Endings Frau Lizz Caplan-Carbin Deutsch für Anfänger.
BAS5SE | Fachhochschule Hagenberg | Daniel Khan | S SPR5 MVC Plugin Development SPR6P.
Alp-Water-Scarce Water Management Strategies against Water Scarcity in the Alps 4 th General Meeting Cambery, 21 st September 2010 Water Scarcity Warning.
Deutsch 1 G Stunde. Donnerstag, der 25. Oktober 2012 Deutsch 1, G Stunde Heute ist ein B- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
Deutsch 1 G Stunde. Donnerstag, der 18. Oktober 2012 Deutsch 1, G Stunde Heute ist ein E- Tag Unit: Family & homeFamilie & Zuhause Objectives: Phrases.
Deutsch 1 G Stunde. Montag, der 10. September 2012 Deutsch 1 (G Stunde)Heute ist ein D - Tag Unit: Introduction to German & Germany Objectives: Introducing.
INTAKT- Interkulturelle Berufsfelderkundungen als ausbildungsbezogene Lerneinheiten in berufsqualifizierenden Auslandspraktika DE/10/LLP-LdV/TOI/
DER FRÜHLING Der Frühling beginnt am 21. März, aber in Nova Scotia ist es im März oft noch kalt, und das Wetter ist meist nicht schön. Erst im Mai wird.
Mein Stammbaum.
Verben Wiederholung Deutsch III Notizen.
Kölner Karneval By Logan Mack
Berner Fachhochschule Hochschule für Agrar-, Forst- und Lebensmittelwissenschaften HAFL Recent activities on ammonia emissions: Emission inventory Rindvieh.
Ein Projekt des Technischen Jugendfreizeit- und Bildungsvereins (tjfbv) e.V. kommunizieren.de Blended Learning for people with disabilities.
The NAMA Facility – Support for the Implementation of NAMAs Subsidiary Body for Implementation in-session workshop on NAMAs Ben Lyon, DECC Norbert Gorißen,
Talking about yourself
Relativpronomen / Relativsätze:
ESSnet Workshop Conclusions.
By: Jade Bowerman. German numbers are quite a bit like our own. You start with one through ten and then you add 20, 30, 40 or 50 to them. For time you.
3rd Review, Vienna, 16th of April 1999 SIT-MOON ESPRIT Project Nr Siemens AG Österreich Robotiker Technische Universität Wien Politecnico di Milano.
Adjectiv Endungen Lite: Adjective following articles and pre-ceeding nouns. Colors and Clothes.
Berner Fachhochschule Hochschule für Agrar-, Forst- und Lebensmittelwissenschaften HAFL 95% der Ammoniakemissionen aus der Landwirtschaft Rindvieh Pflanzenbau.
Relativpronomen / Relativsätze:
Wind Energy in Germany 2004 Ralf Christmann, BMU Joachim Kutscher, PTJ
HRM A – G. Grote ETHZ, WS 06/07 HRM A: Work process design Overview.
KIT – die Kooperation von Forschungszentrum Karlsruhe GmbH und Universität Karlsruhe (TH) Vorlesung Knowledge Discovery - Institut AIFB Tempus fugit Towards.
The NAMA Facility – Support for the Implementation of NAMAs Subsidiary Body for Implementation in-session workshop on NAMAs Ben Lyon, DECC Norbert Gorißen,
Dyabola Archäologische Bibliographie Römisch-Germanischen Kommission (RGK) Author searches – compound names Bibliotheken Click = next Libraries.
1 Stevens Direct Scaling Methods and the Uniqueness Problem: Empirical Evaluation of an Axiom fundamental to Interval Scale Level.
Lehrstuhl für Waldbau, Technische Universität MünchenBudapest, 10./11. December 2006 WP 1 Status (TUM) Bernhard Felbermeier.
Adjective Endings Nominative & Accusative Cases describing auf deutsch The information contained in this document may not be duplicated or distributed.
Selectivity in the German Mobility Panel Tobias Kuhnimhof Institute for Transport Studies, University of Karlsruhe Paris, May 20th, 2005.
GenoMik: Funding of Genome Research on Bacteria 2001 – 2006 Network 1 Topic:Genome Research on Bacteria relevant for Agriculture, Environment and Biotechnology.
KGE Kommunalgrund GmbH Entwicklungsträger der Landeshauptstadt Magdeburg Presentation for the REDIS Project at the Interim Conference.
Technische Universität München 1 CADUI' June FUNDP Namur G B I The FUSE-System: an Integrated User Interface Design Environment Frank Lonczewski.
By Martin L. Loeffler.  The basic sentence has a subject and a verb.  The subject and verb need to be together.  The subject and verb need to agree.
Andreas Burger ZENTRUM FÜR MEDIZINISCHE LEHRE RUHR-UNIVERSITÄT BOCHUM Irkutsk October 2012 Report about the lecture "Report of the TEMPUS IV- Project Nr.
Adjective Declension in German
1 Paul Bennett, Martin Durrell, Silke Scheible, Jason Whitt The GerManC Project A Representative Corpus of Early Modern German ( )
 Präsentation transkript:

1 Paul Bennett, Martin Durrell, Silke Scheible, Jason Whitt The GerManC Project A Representative Corpus of Early Modern German ( )

2 Representative historical corpus of German Aim Facilitation of comparative studies of the development and standardisation of English and German in 17th and 18th centuries Resource needed ARCHER-corpus (also Helsinki Corpus) Model

Representativeness 1. Not complete texts, but extracts of approximately 2000 words (cf. Brown corpora and ARCHER) 2. Nine genres a. Dramas b. Newspapers c. Letters d. Sermons e. Narrative prose f. Journals g. Scholarly texts (humanities) h. Scholarly texts (science & medicine) i. Legal texts 3

Representativeness 3. Periods (cf. Bonn corpus of ENHG) Regions a. North German b. West Central German c. East Central German d. West Upper German (incl.Swiss) e. East Upper German (incl. Austrian) 5. Three extracts of 2000 words per genre/period/region = approx words 4

Pilot Project: GerManC One year grant from ESRC: [March March 2007] Team: Paul Bennett, Martin Durrell, Astrid Ensslin Aim: testing corpus design and aims with a single genre, and evaluating and developing a set of analytical tools Newspapers were selected as genre for the pilot 5

6 Breslau 1683 Wien 1780

Digitization 1. Scanning black letter (Fraktur) texts with OCR proved impractical and prone to error 2. All texts keyed in twice and the results compared electronically (double-keying) to eliminate mistakes 3. Only texts with 2000 words of (more or less) continuous German prose were selected 7

Extended GerManC Pilot project completed March Newspaper corpus lodged with Oxford Text Archive (and available on project website) Application for funding the extended corpus approved early 2008, with equal funding from ESRC and AHRC Original design maintained, eight further genres to be added Team: Paul Bennett, Martin Durrell, Silke Scheible, Jason Whitt Work started in September

Development of tools A capable program for tokenization A program to recognize orthographic variants A lemmatization program with the ultimate aim of lemmatizing the whole corpus The development of an appropriate POS-tagger (on the basis of the Stuttgart-Tübingen Tagset) with a view to tagging the complete corpus Developing a program to enable automatic morphosyntactic tagging of the whole corpus If possible within the time constraints, developing a parser (possibly on the basis of the parser used in York for Old English) and parsing the complete corpus on this basis. 9

10 Changing norms Innerhalb der nach grammatischem Bestimmungswort zu erwartenden indet. Flexion des Nom./Akk.Pl. aller Genera (die klugen Frauen) kommt es zu allen Zeiten des Fnhd. zu einer zwischen -(e) und -(e)n schwankenden Formbildung Gramm. d. Fnhd. VI, 174

Findings: weak adjective inflection 1 (newspapers) process of standardization weak adjective inflection (Durrell et al. 2008) in nom./acc. pl., e.g. : die gute[n] Kinder (die Gute[n]) e-en-e-en-e-en North German20 (6)6 (5)633 (16)132 (14) West Central45 (18)4 (3)18 (4)10 (5)328 (6) East Central7 (2)18 (11)718 (3)231 (5) West Upper25 (7)6 (3)16 (3)6 (2)16 (3)16 (8) East Upper38 (22)14 (11)24 (3)11 (8)334 (5) Total135 (55)48 (33)71 (10)78 (34)25 (3)141 (38)

12 Changing norms Die Entwicklung vom späten 16. Jh. bis zur Mitte des 18. Jhs. erweist die Durchsetzung [von -en] als die Verallgemeinerung eines in erster Linie omd. Usus. Die [...] stilschichtliche Distribution bestätigt die Einschätzung bei Hemmer [...], daß -n über literarische Sprachvorbilder übernommen worden ist. (Gramm d. Fnhd. 176)

Findings: weak adjective inflection 2 (literary genres) Preliminary examples from drama and narrative prose in new extended corpus e-en-e-en-e-en North German219 (2)7 (2)23 (7)025 (7) West Central219 (7)6 (1)14 (5)68 (1) East Central224 (3)1 (1)23 (4)017 (3) West Upper5003 (1) 21 (5) East Upper211 (2)5 (1)3 (1) 14 (2) Total1373 (14)19 (5)78 (34)12 (2)85 (18)

14 Morphological simplification: zwei Bei den Grammatikern ist bis in die 2. Hälfte des 18. Jh. hinein die Genusdifferenzierung aufrechterhalten (Schottel, Bödiker, Gottsched) Erst Adelung (a. 1782) gibt ausschließlich die Form zwey für alle Genera. (Gramm. d. Fnhd. VII, 539)

15 Morphological simplification: zwei Am frühesten ist das Neutrum als Einheitsform festgeworden im Niederdeutschen [1303]. Im Ostmitteldeutschen (Obersächsischen und Schlesischen) herrscht es seit der Mitte des 17. Jhs. und drang von dort auch in die Literatursprache (Schirmunski, Deutsche Mundartkunde, 474).

16 zwei in newspaper corpus

Morphological simplification: zwei In newspapers occasional gender forms in those areas where they occur in the dialects, especially WCG and, notably, Erfurt zween in newspapers only before 1700, thereafter sporadic. Only one text (Frankfurt 1671) consistently maintains gender distinction 17

zweenzwozweizweenzwozweizweenzwozwei North German West Central German East Central German West Upper German East Upper German zwei in extended corpus to date

19 Morphological simplification: zwei In other texts zwei/zwey are dominant throughout, but other forms occur sporadically, even in the North. But Herder Abhandlung über den Ursprung der Sprache (North German 1772) uses the gender forms - but not consistently correctly (e.g. zwey Parteien)

Historical/cultural findings Media history Ensslin (2009), Im Unterhause groß Getöse: representations of 18th century British parliamentary democracy in Early Modern German newspaper discourse The representation of a parliamentary monarchy in 17th & 18th century Germany, with predominantly absolute rulers - but responding to increased interest in Britain ruled by the Hannoverians Initially straightforward factual presentations, concise and apparently objective, though with (intentional?) emphasis on the leading role of the king Later clear tendency towards stigmatization of the raucous debates in the House of Commons, with a much more subjective style of presentation and often sensationalist tone 20

21 Erfurt 1744

22 (Freyburgerzeitung, 28 January 1784): Die Veränderungen des neuen Ministeriums machen im Unterhause abscheulich groß Getöse. Dieß Ministerium hat wirklich schon die herrlichsten Namen aufgeheftet gekriegt: einige schelten selbes die kleine Pastetengebäckadministrazion, andere, die Bildsäule Nabukadnezars. Pitt, der nun an der Stelle des Fox ist, ist ein Gegenstand des öffentlichen Spottes scheelsüchtiger Satyriker.

Thank you Contacts: Web page: 23

Project publications Martin Durrell, Astrid Ensslin and Paul Bennett, "The GerManC project", In: Sprache und Datenverarbeitung 31 (2007), Martin Durrell, Astrid Ensslin und Paul Bennett, "Zur Standardisierung der Adjektivflexion im Deutschen im 18. Jahrhundert". In: W. Czachur and M. Czyzewska (eds.), Vom Wort zum Text. Studien zur deutschen Sprache und Kultur. Festschrift für Professor Józef Wiktorowicz zum 65. Geburtstag. Warszawa, Instytut Germanistyki Uniwersitetu Warszawskiego, 2008, pp Martin Durrell, Astrid Ensslin und Paul Bennett, "Zeitungen und Sprachausgleich im 17. und 18. Jahrhundert. In: Zeitschrift für deutsche Philologie 127 (2008), Sonderheft, pp Ensslin, Astrid (2008), '"Im Unterhause abscheulich groß Getöse". Representations of 18th century British parliamentary democracy in early modern German newspaper discourse and their treatment of borrowings from English'. In: Pfalzgraf, F. & Rash, F. (eds.), "Anglo- German Literary Relations". Bern, etc.: Lang, pp