Tomáš Kářia
Elektronische Sprachkorpora in Wissenschaft und Unterricht DaF/DaZ - einige Vorschläge für die Nutzung der elektronischen Instrumente1
Neue Technologien gewinnen immer mehr an Bedeutung - sogar in solchen Bereichen, die primär keine aufwändige Technik benöligen. Sie setzen sich selbst dort durch, wo man sie vor einigen Jahren noch nicht erwartet hätte. Ein solcher Bereich ist wohl auch die Fremdsprachenvermittlung.
In diesem Bettrag möchte ich auf elektronische Sprachkorpora fokussieren, einen Ausschnitt aus der Arbeit mit ihnen präsentieren und so ein Spektrum an Ideen für die Nutzung der Korpora im Bereich DaF/DaZ mit Schwerpunkt auf die Wortschatzarbeit eröffnen. Vor dem Ausflug zu den Korpora und in ihre Daten sollte zuerst kurz; erwähnt werden, welche Bedeutung die Korpuslinguistik in der heutigen Zeit hat und welche Korpora es gibt, die für DaF/DaZ von Bedeutung sind.2
Die Nutzung der elektronischen Sprachkorpora ist in der Fremdsprachen forschung und im Unterricht ein relativ neues Element. Bis heute bedient man sich der traditionellen empirischen Instrumente (vgl. z.B. Muzikant 2007), die auch in Zukunft nicht an Bedeutung verlieren werden. In den letzten Jahren aber ist in vielen Sprachforschungsbereichen (vgl. Pelouäkova 2005) und auch im Sprachunterricht eine Orientierung auf die effektiven Korpusmethoden deutlich sichtbar (Kasova 2006). So basieren beispielsweise die in den letzten jähren erschienenen Grammatiken und Wörterbücher weitestgehend auf Recherchen in elektronischen Korpora (Zifonun et al. 1997; Wermke et al. 2005; Klosa et al. 2001 u.v.a.m.).
1. Korpuslinguistik
Die Korpuslinguistik ist jener Teil der Linguistik, der die Sprache systematisch anhand großer Mengen von realisierten sprachlichen Äußerungen (Parole) untersucht Das Ziel des korpuslinguistischen Ansatzes in der modernen Linguistik ist es, die Strukturen und Funktionen der natürlichen Sprache besser und realitätsnäher zu beschreiben (vgl. z.B. Biber et al. 1998). Damit ist die Korpuslinguistik keine neue Theorie der linguistischen Untersuchung, sondern eher eine effektive Methode der Sprachforschung.'
123
Zu Nutznießern der Korpora zählen Philologinnen im weiteren Sinne (auch Lite-raturwissenschaftlerlnnen können elektronische Korpora gut nutzen - z.B. für eine Recherche über typische Kollokationen eines/einer Autors/Autorin), Übersetzerinnen und Dolmetscher und Dolmetscherinnen, Sprachlehrerinnen, Schüler und Schülerinnen, Studenten und Studentinnen und eigentlich alle, die Interesse an dem Phänomen Sprache haben, denn die meisten elektronischen Korpora sind leicht zugänglich und auch für nicht Computergewandte einfach zu nutzen.
1.1. Korpusrecherche vs. traditionelle Datenerhebung
Die Vorteile der Arbeit mit elektronischen Korpora sind spätestens dann klar, wenn jemand sich eine (linguistische oder linguistisch bezogene) Frage stellt und die Antwort mit konkreten Beispielen belegen möchte. „Sagen Sie das E-Mail oder die E-Mait? Und wie schreiben Sie das? E-Mail oder E-mail?" Statt einer Umfrage bei Muttersprachlerinnen - was sich für Deutschlernende im Ausland besonders schwierig darstellt - oder statt einer langwierigen Recherche in diversen gedruckten Texten, bietet bereits eines der Korpora eine überwältigende Anzahl von Belegen: 18.090-mal E-Mail und 5.374-mal E-mail hat der Korpusmanager in über 4 Millionen unterschiedlichen Texten (über eine Billion Worter)* binnen 15 Sekunden im Mannheimer Korpus gefunden. Und mit diesen Daten kann man weiter analysieren - z.B. in weichen Texten das E-Mail oder die E-Mail vorkommt Wie lange würde eine manuelle Recherche für dasselbe Ergebnis dauern?
2. Korpustypen
Für einen erfolgreichen Datengewinn ist zunächst die Korpuswahl sehr wichtig. Die Überlegung, welche Recherche ich unternehmen will, mündet logischerweise in die Wahl des geeigneten Instruments. Erwähnt werden hier nur für DaF/DaZ relevante Korpora.
2.1. Diachrone und synchrone Korpora
Für die historischen Untersuchungen der Sprache gibt es bereits einige Korpora - z.B. die Mittelhochdeutsche Begriffsdatenbank (MHDBDB) an der Salzburger Universität oder Dos digitale Wörterbuch der deutschen Sprache des 20. Jahrhunderts (DWDS), das zwar ausschließlich das Neuhochdeutsche erfasst, sich jedoch wunderbar als Instrument zur Erfassung der (Ver-)Änderungen des Deutschen im vorigen Jahrhundert eignet (Beispiele siehe Kap. 4.1.2.).
Zur Betrachtung der heutigen deutschen Sprache sind schon einige Korpora für jeden per Internet zugänglich: z.B. Das Deutsche Referenzkorpus (DeReKo) am IDS-Mannheim, das Korpus Wortschatz erstellt von der Informatik der Universität Leipzig oder das schon erwähnte DWDS, um nur einige zu nennen.
22. Korpora der gesprochenen und geschriebenen Sprache
Alle bisher erwähnten Korpora erfassen nur die geschriebene Sprache. Es gibt allerdings einige Korpora der gesprochenen Sprache, z.B. das Deutsche Spracharchiv (DSAv) und die Datenbank Gesprochenes Deutsch (DGD) - beide am IDS-Mannheim.
2.3. Einsprachige und parallele Korpora
Parallele (mehrsprachige) Korpora sind viel seltener als einsprachige, weil ihr Aufbau wesentlich komplizierter ist, da die entsprechenden Passagen einander zugeordnet (aligned) werden müssen. (Kafia/PelouSkova 2006b)
2.4. Relevante Korpora für DaF/DaZ
Es gibt also mehrere Korpora des geschriebenen und gesprochenen Deutsch, wo die Sprache in ihrer natürlichen Form, also in authentischen Texten, erscheint. Zur Demonstration der Arbeit mit diesen Instrumenten in diesem Beitrag wählte ich die folgenden Korpora:
» Das Deutsche Referenzkorpus (DeReKo) am IDS-Mannheim - „die weltweit größte Sammlung elektronischer Korpora mit geschriebenen deutschsprachigen Texten aus der Gegenwart und der neueren Vergangenheit"5
• Das digitale Wörterbuch der deutschen Sprache des 20. Jahrhunderls (DWDS)« an der Berlin-Brandenburgischen Akademie der Wissenschaften
• Wortschatz am Institut für Informatik der Universität Leipzig7
> Das tschechisch-deutsche Parallelkorpus (CNPK) an der Masaryk- Universität Brünn - das größte Parallelkorpus für Tschechisch und Deutsch' - erwähne ich hier als einen Vertreter der Parallelkorpora.
Technische Angaben, sowie die Syntax der Korpusabfrage sind den jeweiligen Dokumentationen (Internetseiten) der Korpora zu entnehmen.
124
125
3. Möglichkeiten der Nutzung von Korpora
Elektronische Korpora kann man für die Untersuchung aller Ebenen der Sprache nutzen, wenn auch mit unterschiedlichem Aufwand. Text- und Satzsemantik können aus den bisher raren und nur schwer zugänglichen „geparsten" (syntaktisch annotierten) Korpora schöpfen. Für andere Bereiche eignen sich hingegen viele relativ gut zugängliche und einfach zu bedienende Korpora. Im Phonetikunlerrlcht können Korpora der gesprochenen Sprache von großer Hilfe sein, weil ihre Daten oft auch akustisch abrufbar sind (DSAv und DGD aber auch andere, wie z.B. Bayerisches Archiv für Sprachsig-nale). Grammatik, Orthographie und der Wortschatz lassen sich am besten an Korpora der geschriebenen Sprache eruieren. Diese sind nämlich viel großer als die Korpora der gesprochenen Sprache.
3.1. Grenzen der Möglichkeiten
Die Vorteile der Korpusarbeit sind unumstritten. Es ist allerdings auch darauf hinzuweisen, dass die Korpora in einigen Bereichen keine Hilfe sein können. Zu diesen zählen unter anderem:
• kontrastive Forschung der gesprochenen Sprache
• Untersuchung der im Korpus nicht vorhandenen Texte (z.B. Aufschriften)
• literaturwissenschaftliche Arbeiten im engeren Sinne (Interpretationen, Kompara-tistik)
• Aufstellung absoluter Urteile über die Sprache
Darüber hinaus ist festzuhatten, dass jedes Korpus durch seine Große bzw. Ausgewogenheit der Texte begrenzt ist. Nichtsdestotrotz kann der Beitrag der elektronischen Korpora für die Spracharbeit äußerst ergiebig sein. Das möchte ich am Beispiel der Wortschatzarbeit demonstrieren.
4. Wortschatzarbeit mit den Korpora
Die Wortschatzarbeit mit dem Korpus kennt fast keine Grenzen, da auch der Wortschatz einer Sprache nahezu unbegrenzt ist Aufgrund der einfachsten Fragen im Korpusmanager (Wortform, Wottkombination, Lemma und Tag = morphologische Kategorie3) lassen sich die wichtigsten Informationen über das abgefragte Phänomen gewinnen. Im Folgenden möchte ich zeigen, wie zwei Konkurrenzformen in verschiedenen Korpora vertreten sind (4.1.), also wie die Wörter im Wortschatz des 20. Jahrhunderts eingebettet
126
sind Anhand einiger Übungen möchte ich vorführen, welche Möglichkeiten die elektronischen Korpora für die Vermittlung des Deutschen im DaF/DaZ-Unterricht bieten (4.2.). Beide Kapitel setzen sich zum Ziel, das Spektrum der in den Korpora enthaltenen Informationen vorzustellen, die in der vorelektronischen Zeit kaum zu gewinnen waren.
4.1. Fallbeispiel der Korpusarbeit: Tschechien und/oder Tscheche!
Die Tschechen, vor allem die Generationen, die den größeren Teil ihres Lebens noch in der Tschechoslowakei erlebt haben, weigern sich oft sich mit der „neuen" Bezeichnung ihres Landes („Česko") zu identifizieren. Diese klingt für tschechische Ohren etwa wie „Tscheche-" im Deutschen. Paradoxerweise wissen aber viele, wie das Land auf Deutsch heißen soll: nämlich Tschechien.10 Ja auf keinen Fall die Tschechen Aus historischen Gründen, selbstverständlich.
Fragestellung: Wie, wann und wo werden diese zwei Benennungen in deutschen Texten vervendetf Und wird auf Tschechisch differenziert, wenn im entsprechenden deutschen Text Tschechien oder Tschechei síeřiti*
4.1.1. Synchrone Distribution
Den ersten Eindruck über die Häufigkeit der Verwendung liefert das IDS-Korpus DeReKo: Hier überwiegt eindeutig die Form Tschechien (38.500-mal) vor Tschechei (nicht einmal 1.000-mal). Die Anzeige der Treffer in den einzelnen Dokumenten ergibt, dass das Wort Tschechei nur in öffentlich zugänglichen Zeitungstexten und fast ausschließlich in österreichischen, seltener in schweizerischen, jedoch kaum in bundesdeutschen Zeitungen, vorkommt. Die Textsortendistribution ist im IDS-Korpus schwer zu erschließen, denn der Öffentliche Teil des Korpus besteht fast ausschließlich aus Zei-tungs- und Zeitschriftentexten.
Die zeitliche Distribution von beiden Wörtern aus der synchronen Sicht ist ungefähr gleich. Beide Worter kommen am häufigsten zwischen den Jahren 1996 und 1998 vor.
4.1.2. Dlachrone Distribution (20. Jahrhundert)
Eine wenig überraschende graphische Statistik über den Gebrauch des Wortes Tschechei im ganzen 20. Jahrhundert liefert das DWDS. Das Vorkommen der AJJonyme in den Korpustexten (in absoluten Zahlen) stellt das Instrument nach Dekaden automatisch dar:
127
Verlaufestatistik für .Tschechei' im DWOS-Korpus
	
	
	
	
L	i
-1	n  _  _  ■ ■
■Gebrauchsllterattir ■ Zeitung ■WHiWschaft
O Belletrist*
1900   1910   19Í0   19»   WM   1950   1960   19V0   19B0 »90
Grafik 1:
Tscheche: Das Wort Tscheche! kommt laut Korpusdaten am 50er (ahren de! 20. Jh. In „GebrauchsteMen" (hellgrau) vor.
teil in den 40er und
		Verfaufcstatlstlk für .Tschechien'		
		im DWDS-Korpus		
25				
20				
				
15				■ Gebrauchsliteratur
				■Zeitung
				■Wissenschaft
				□ BclletrJtttlt
5	■			
0 J	1900   »10 1920	1930  1940  1950   1960   19»   1H0 19	90	
Grafik 2:
Tschechien: Die Form Tschechien ist ersr ra den (meist) publizistischen (dnnkeigrau) Teilen aus den War Jahren vertreten.11
4.1.3. Tschechische Entsprechungen
Da wir es hier mit einer lexikalischen Divergenz zu tun haben (Deutsch: Tschechien und Tschechei - zwei Simplexwörten Tschechisch Česko - ein Simplexwort), bietet sich die Frage an, wie die deutsche Dichotomie im Tschechischen gelöst wird. Die Antwort kann das Tschechisch-deutsche Parallelkorpus andeuten:
(la) Meine Mutter war ja da noch in der Resttschechoslowakei, Tschechei, denn die
Slowakei hat sich ja auch selbständig gemacht, (lb) Maminka potom byla ještě ve „zbytku Československa", tedy v Česku, protože
Slovensko vyhlásilo samostatnost. (2a) Oder sie haben sich von daheim von irgendwas die Etiketten rausgetrennt und
haben sie in einen neuen Mantel reingenäht, weil in der Tschechei alles billiger
war...
(2b) Nebo doma z něčeho odpárali Štítky a našili je na nový kabát, protože v Česku
bylo všechno laciněji!... (3a) Sind wir wirklich bereit, dem Ski-Tourismus einen der landschaftlich schönsten
Winkel in der Tschechel zu opfern? (3b) Jsme připraveni neomezenému lyžováni obětovat ochranu jednoho z nej-
vzácnějsích koutů České přírody?
Der Form Tschechei (im Korpus allerdings nur 22-mal) entspricht im ČNPK in den meisten Fällen das „neue" Wort Česko, egal ob es sich um das Land zwischen 1938 und 1945 (1), um eine umgangssprachliche Kürzung der Tschechoslowakischen sozialistischen Republik (2) oder um die Tschechische Republik nach 1993 (3) handelt. (Das Adjektiv český (3b) ist allerdings vom Substantiv Čechy [Böhmen] abgeleitet, kann jedoch auch als eine Derivation von Česko betrachtet werden.)
Der Eigenname Tschechien (mit 100 Treffern) kommt in den Paralleltexten häufig als česká republika (der offizielle Name des Landes) (4) oder CR (5), oft auch als eine politisch korrekte, inoffizielle Bezeichnung České země („Tschechische Länder", also Böhmen und Mähren) (6), vor.
(4a) Gerade in der Gegenwart rücken die osteuropäischen Staaten wie Polen, Ungarn, Tschechien, die Slowakei, Slowenien, Kroatien und Bosnien in das Gesichtsfeld Mitteleuropas.
(4b) Právě dnes se státy jako Polsko, Maďarsko, Česká republika. Slovensko, Slovinsko, Chorvatsko či Bosna stávají středem zájmu.
(5a) In Tschechien ist es ein einzigartiges Beispiel eines Herrensitzes, der durch französische Architektur aus der Zeit des Königs Louis XVI. inspiriert war.
128
129
<Sb) V CR ojedinělý přiklad panského sídla inspirovaného francouzskou architekturou zdoby Ludvika XVI.
(6a) Die Teilung der Tschechoslowakischen Föderativen Republik zum 1.1.1993 brachte außer dem Ende des Bestehens der ČSD auch die Entstehung der eigenständigen Tschechischen Bahnen (CD) und der Eisenbahn der Slowakischen Republik (2SR), als auch die weitere Schwächung des Eisenbahnverkehrs zwischen Tschechien und der Slowakei. \
(6b) Rozděleni Československé federativni republiky k 1.1,1993 přineslo kromě zániku CSD a vzniku samostatných Českých drah (ČD) a Železnic Slovenska republiky (ŽSR) také dalíí oslabení železniční přepravy mezi českými zeměmi a Slovenskem.
4.1.4. Typische Kollokationen
Alle Korpora können auch die typischen oder häufigsten Kookkurrenzen (Kollokationen) zu den gesuchten Wörtern aufzeichnen. Für Tschechien und Tschechei sind es die Präpositionen nach bzw. in, aber auch gegen (das Land wird oft in den Sportnachrichten erwähnt). Als autosemantische Kollokatoren kommen (fast ausschließlich) andere Länder vor - zum Beispiel in den Nachrichtentexten mit Auflistungen der EU-Beitrittsländer oder eben auch als Gegner Tschechiens in verschiedenen Sportarten.
4.1.5. Fazit
Die Recherchen in drei Korpora deuten darauf hin, dass die Benennung Tschechien sich im Deutschen in den letzten Jahren des 20. Jahrhunderts durchgesetzt hat, die allonyme Form Tschechei ist aber damit lange noch nicht ausgestorben. Tschechei bleibt auch in einigen belletristischen Texten lebendig (z.B. im CNPK handelt es sich um eine Übersetzung von Jáchym Topol's „Sestra/Die Schwester").
Der Form Tschechien entspricht im Tschechischen in etwa die offizielle Bezeichnung Česká Republika oder die Umschreibung ieské země. Dem oft negativ konnotierten Worl Tschechei steht im Tschechischen auch die Form Cesko gegenüber, die übrigens eher negativ (umgangssprachlich, salopp) bewertet wird.
Die Ergebnisse zeigen, dass die bestehenden Korpora interessantes Material zu einer tiefer gehenden Untersuchung liefern können. Dabei verliert man keine Zeit mit der Datenerhebung, denn die Abtrage im ČNPK15 dauert wenige Sekunden. Eine vergleichbare manuelle Recherche in parallelen Texten würde mehrere Jahre dauern.
4.2. Wortschatzübungen mit den Korpora
Die elektronischen Korpora stellen auch ein blitzschnelles und relativ zuverlässiges Hilfsmittel für Lehrer und Lehrerinnen für die Erstellung von Wortschatzübungen dar (4.2.1.)- Das bedeutet das Aus für künstlich ausgedachte Übungssätze, die erstens die Autorinnen viel Energie kosten und zweitens nicht immer ganz realitätsnah klingen. Mit einem Internet- und Korpuszugang können aber auch die Lernenden selbst vieles über die Sprache erfahren (4.2.2.).
4.2.1. Qbungsbeisplele
Mit Hilfe der einsprachigen Korpora lässt sich ein breites Spektrum an Ergänzungsübungen erstellen. Diese können z.B. so aussehen:
Ergänzen Sie ziehen oder schleppen in der richtigen Form:"
Nein, so was wird man nicht los, das		ich weiter mit mir nun, solange ich lebe.
DerVersuehsleiter		die Karlen der Reihenfolge nach und ...
Er packte mich am Ärmel und		mich durch den Gang zwischen den Sitzen-
CHt Baronin		iniwischen die Geschenke aus dem Koib.
Was fehlt hier?"
Wetterdach, hüig ein alter_		an diesem Wegkreui, das zu
Material ist in einem mobilen		unterfcebracht, die
Haneartner. Das Delikate am		ist, so Mauro Ferrari, dass
_Sm_,-i----1. werden. Eben bekommt auch der		des Rroßen Kreuzes aus der
neu nummeriert, damit diese im		aufbewahrt werden können.
Von Tobey hat der Sammler ein		von 40 Werken.
_ <-•-- führt - mitverarbeitet Der_		Christi stammt aus Rom.
130
131
Ergänzen Sie Honig, Leberwurst, Süppchen oder Wekkel."
... wie sich einige Landet hie und da irgendein vergessenes historisches..........aufwärmen.
Sei kein.........., lass Dir nichts gefallen.
Ich werde nicht die beleidigte..........spielen, mich auch auf diesem Posten voll einsetzen. Aber ich will meinen alten Job zurückhaben.
Ich will dir keinen..........ums Maul schmieren. Ab« ich habe mich gewundert, wie
du gespielt hast. Hut ab vor deiner Leistung!
Ergänzen Sie die Pluralformen.1*
RIO DE JANEIRO. Verheerende Regen..........haben in den brasilianischen Bundesstaaten Alagoas und Pemambuco bisher 56 Menschen das Leben gekostet.
Schließlich soll für jeden Geschmack und für alle Alters..........etwas dabei sein.
Mit der Konzeption hatte die Stadt die Sound of Frankfurt Veranstaltungs-GmbH beauftragt.
Die Umfrage des Verbandes zeigte: das Modell hat Mangel. Der Vorstand errechnete, dass es bei einer Realisierung unter den Gemeinden „mehr Pechvögel als
Glücks.........." gäbe. Dem Modell wird angelastet: Es ist unausgereifL
Echte Äpfel türmen sich zu bunten Bergen, Kohl..........in allen Variationen liegen in
den Steigen. Kartoffeln mit echten Erdresten sind in Säcke abgefüllt.
Parallele Korpora ermöglichen den kontrastiven Blick auf die Strukturen der Sprachen durch simple Übungen:
Setzen Sie passende Diminutivformen ein, falls dies möglich ist"
Wir sind doch schon fertig, Danny. Oder war das..........(Albert)?
My uí jsme hotovi, Danny. Nebo to byl Bertík?
Hier, mein..........(Tochter), fühle ich mich am besten. Sogar sterben möchte ich
hier.
Tady já. cérecko, mám sa najlepíf. Aj umřít bych tu chtěl.
Ehe ich aber darauf zu sprechen komme, möchte ich die verehrte Frau Bednarek bitten,
mir ein..........(Glas) mii Gespritztem (österr.) zu bringen, weißem natürlich
Ale nei se do toho pustím, požádal bych ctěnou Frau Bednarek, aby mi přinesla sklenku vinného střiku, bílého samozřejmé.
Geruhten Sie gut zu..........(schlafen)?
Ráčil jste spinkat, že?
4.12. Aufgaben zum Selbststudium
Einige Korpora ähneln bereits einem Thesaurus: Einen schnellen Überblick über die Beziehungen eines Wortes verschafft das aus „öffentlich zugänglichen Internettexten automatisch aufgebaute Korpus"" Wortschatz an der Leipziger Universität Eine einfache Abfrage zeigt dem Benutzer neben den grammatikalischen Angaben (alle Konjugationsformen, Partizipbildung etc.) auch paradigmatische Beziehungen des Wortes (Wortfeld, Synonyme, Antonyme) sowie auch syntagmatische Beziehungen -rechte und Unke Nachbarn, typische Kollokatoren. Beispiele in Form einiger Konkordanzzellen fehlen auch nicht So stellen die elektronischen Korpora auch ein einzigartiges Instrument fürs autonome Lernen dar."
• Was sind die typischen Kollokatoren vom Verb ziehen?
• Wann hat der Hit den Schlager abgelöst?
• Sind die Wörter Trupp, Effeß, Pack und Kegel Monokollokate?
• Was entspricht im Tschechischen (Englischen, Slowakischen, Französischen ...) dem österreichischen Wort Buschenschank?
So könnten die Aufgaben zum Selbststudium lauten. In diese Kategorie gehört auch die unter 4.1. angeführte Recherche.
5. Zusammenfassung und Ausblick
Mit der Präsentation der Teilergebnisse einer linguistischen Untersuchung (Kap 4.1.) und mit einigen Beispielen von Übungen und Aufgaben, die auf Korpusdaten basieren, wollte ich in diesem Beitrag nicht nur die Breite des Spektrums der Korpusarbeit andeuten, sondern in erster Linie auf die Effektivität und Geschwindigkeit der Datenerhebung hinweisen.
Im Bereich der Sprachforschung wurden bereits einige Arbeiten von unterschiedlichem Umfang (von Seminararbeiten über Dissertationen, bis zu Wörter- und Grammatikbüchern) anhand der Korpusinstrumente verfasst. Viele Fragen der kontrastiven Sprachuntersuchung bleiben aber vorerst unbeantwortet, weil die entsprechenden Instrumente fehlen. Es gibt schon mehrere Parallelkorpora (MULTEXT, Europarl u.a.), alle sind jedoch entweder zu klein oder zu spezifisch für eine allgemeine kontrastive Sprachuntersuchung (und dadurch auch für die allgemeine Fremdsprachenvermittlung). Als viel versprechend können die Arbeiten am Multikorpus Intercorp" betrachtet werden, einem Korpus, das seit 2001 in Prag entsteht, und fast alle europäischen und auch einige asiatische Sprachen beinhalten wird.
132
133
Wir haben nun einen kleinen Einblick in die vielfältigen Anwendungsmöglichkeiten von Korpora erhalten. Angesichts der Tatsache, dass Korpora eine ausgezeichnete Basis darstellen, um die Sprache realitätsgetreu und in Ihrer Vielfalt zu vermitteln, erstaunt es, dass die Lehrbuchautorinnen in ihren interaktiven Zusatzmaterialien bisher kaum auf allgemein zugangliche Korpora verweisen oder gar mit ihnen arbeiten. Ebenso gefordert wäre natürlich die Lehreraus- und -fortbildung, dieses Instrument den Lehrenden für den (Fremd-)Sprachenunterricht vertraut zu machen.
Anmerkungen
1 Dieser Artikel entstand im Rahmen des Forschungsvorhabens MSM 0021620823.
2 Da ich meinen Beitrag als Anregung fiir die Arbeit mit verschiedenen Korpora und Korpus-inslromenten sehe, wird hier auf Definitionen der Grundbegriffe und der Basisfunktionen, die Jedes Korpus in der Dokumentation ausführlich beschreibt, verzichtet Siehe dazu auch: Biber et al. 1998; Čermák/Blatná 2006; Lemnitzer/Zlnsmeister 2006; Kána 2006.
3 Korpora hat es )a auch früher gegeben, ihre Aufstellung und die Recherchen waren allerdings umständlich.
4 IDS-Korpus - ößendiche Version.
5 http://www.ids-mannheini.de/kl/projekte/korpora/.
6 http://www.dwds.de/.
7 http://wortschatz.uni-leipzig.de/.
8 Aus urheberrechdichen Gründen nur intern zugänglich. Eine Liste der parallelen Korpustexte Ist unter: http://www.ped.niunLcz/wger/, Icon „různé", „katalog řnpk" abrufbar.
9 Kána 2006.
10 Zu diesem Thema gab es z.T. heftige Diskussionen in den tschechischen, aber auch in deutschen und österreichischen Zeitungen nach 1993 (|ahr der Trennung der Tschechoslowakei). Siehe dazu auch das IDS-Korpus.
11 Tschechien ist jedoch keine Neuprägung der 90er Jahre. Es ist auch in zwei Dokumenten aus den 20er fahren belegt.
12 Das ČNPK beinhaltet über 6 Millionen tschechische Wörter und über 6,5 Millionen Wörter in der deutschen Parallele in 200 unterschiedlichen Texten.
13 Quelle; das ČNPK
14 Quelle: IDS-Korpus.
15 Quelle: IDS-Korpus.
16 Quelle: IDS-Korpus.
17 Quelle: Kaňa 2005,86-87.
18 http://corpora.informatik.uni-leipzig.de/downloadJiUnl unter „Disclalmer".
19 Kasová 2006.
20 Ein Teil dieses Multikorpus (https://tmka.ff.cuni.cz/ucnWtatercorp/) bildet auch das ČNPK, ein Korpus, das vielen tschechischen DaF-Studentlnnen und DaF-Lehrerlnnen seit einigen Jahren zur Verfügung steht.
Literatur
Biber, Douglas/Conrad, Susan/Reppen, Randi (1998), Corpus Linguistics. Investiga-ting Language Structure and Use, Cambridge: Cambridge University Press.
Čermák, František (2006), „Korpusová lingvistika dnešní doby", in: František Čermák/Renata Blatná (Hrsg.), Studie z korpusové lingvistiky, Praha, 9-18.
Kána, Tomas (2005), Wortbildung. Umriss der Theorie mit Übungen, 1. Aufl., Brno.
Kána, Tomas (2006), „Korpuslinguistik - eine übersehene Herausforderung für den Deutschunterricht?" in: Paul R. Portmann-Tselikas/Hans-)ürgen Krumm (Hrsg.), Theorie und Praxis, österreichische Beiträge zu Deutsch als Fremdsprache Band 9/2005. Schwerpunkt: Innovationen - Neue Wege im Deutschunterricht, Innsbruck/ Wien/Bozen: Studienverlag, 99-115.
Káňa, Tomáí/Pelousková, Hana (2006a), „Elektronische Korpora in Tschechien und das tschechisch-deutsche Parallelkorpus", in: Bernhard Kettemann/Georg Marko (Hrsg.), Planing, Gluingand Painting Corpora. Inside the Applied Corpus Linguisl's Workshop, 1. Aufl., Frankfurt am Main: Lang, 27-46 (= Sprache im Kontext 24). . Káňa, TomásVPelousková, Hana (2006b), „Was kann das parallele Korpus? Funktionen, Möglichkeiten und Grenzen", in: FF UCM 8t Gesellschaft für Sprache und Sprachen (Hrsg.), Sprache und Sprachen int mitteleuropäischen Raum, Trnava, 603-615.
Kasová, Martina (2006), E-Leaming - vyulitie internetových projektov pri priprave
učitetov německého jazyka, Prešov. Klosa, Annette et al.. Hrsg. (2001), DUDEN-Deutsches Universalwörterbuch, 4. Aufl.,
Mannheim/Wien u.a. Lemnitzer, Lothar/Zinsmeister, Heike (2006), Korpuslinguistik. Eine Elnßhrung,
Tubingen: Narr.
Muzikant, Mojmír (2007), Deutsche Dialekte in Tschechien, ihre Gemeinsamkeiten und Besonderheiten im Vergleich zum Mutterboden, Brno.
Peloušková, Hana (2005), „Informační technologie Jako podpora studia učitelství německého jazyka", in: Věra Janiková/Tomás Káňa (Hrsg.), Inovativní tendence v kurikulu studijního oboru „Učitelství německého jazyka pro základní školy", Brno.
Wermke, Mathias et al., Hrsg. (2005), DUDEN - Die Grammatik, 7. Aufl., Mannheim.
Zifönun, Giseta/Hoffmann, Ludger/Strecke, Bruno u.a. (1997), Grammatik der deutschen Sprache, Berlin.
Korpora
Bayerisches Archiv für Sprachsignale:
http://www.phonetik.uni-muenchen.de/Bas/BasHomedeu.html
134
135
V
Das deutsche Referenzkorpus (DeReKo):
http:// www.ids-mannheim.de/kl/projekte/dereko/
Das digitale Wörterbuch der deutschen Sprache des 20. Jahrhunderts (DWDS): http:/ / www.dwds.de/
Deutsches Spracharchiv (DSAv) und Datenbank Gesprochenes Deutsch (DGD):
http;//dsav- oeff. ids~mannheim.de/
htterCorp:
https://trnka.ffcuni.cz/ucnJc/iiitercorp/ Mittelhochdeutsche Begrißsdatenhank (MHDBDB); http://mhdbdb.sbg.acat:BOOO/
Tschechisch-deutsches Paraileikorpus/Cesko-nimeckyparaklni korpus (CNPK): momentan kein öffentlich« Zugang Wortschatz - Universität Leipzig: http://wortGchatz.uni-leipiig.de/
136