Methoden des empirischen Arbeitens in der Linguistik
Aufgabe 1
Teil 1: Es gibt 3 mögliche falsifizierbare Hypothesen, nämlich:
1. Die Produktion von kontextuellen Flexionselementen dauert länger als die von bedeutungstragenden.
2. Die bedeutungstragenden brauchen länger als die kontextuellen.
3. Die bedeutungstragenden und die kontextuellen unterscheiden sich nicht.
Hypothese 1 ist falisifiziert, wenn die bedeutungstragenden länger brauchen oder kein statistisch bedeutsamer Unterschied herauskommt.
Hypothese 2 ist falsifiziert, wenn die kontextuellen länger brauchen oder kein Unterschied besteht.
Hypothese 3 ist falsifiziert, wenn entweder die Produktion der bedeutungstragenden oder die der kontextuellen so viel länger dauert, dass der Unterschied statistisch von Bedeutung ist.
Teil 2: Das Experiment ist schon in Vielem ganz gut geplant, es sind immer dieselben Wörter, also brauchen Sie sich keine Sorgen darüber zu machen, dass die Häufigkeit der Wörter Ihr Ergebnis beeinflusst. Man könnte allerdings darüber nachdenken, ob Plurale nicht häufiger in der Sprache vorkommen als Genitive, jedoch kommen Genitive als Attribute (wie in diesen Sätzen) durchaus noch reichlich vor.
Wenn das Ergebnis ist, dass die Sätze mit Genitiv-s eine längere Produktionszeit haben, dann haben Sie kein Problem. Sie können sagen, Sie haben hiermit einen starken Hinweis darauf gefunden, dass kontextuelle Flexion eine längere Produktionszeit braucht, und sollten nur zur Sicherheit überprüfen, ob die im Experiment benutzten Wörter nicht erheblich seltener im Genitiv vorkommen als im Plural.
Wenn aber das Ergebnis ist, dass die Sätze mit dem Plural-s eine längere Produktionszeit brauchen, dann haben Sie ein Problem. Denn das könnte zwar die Ursache haben, dass die bedeutungstragende Flexion eine längere Produktionszeit braucht, aber es könnte auch ganz andere Ursachen haben. Im Deutschen gibt es ja schon ohne Betrachtung des Umlauts 5 regelmäßige Plurale (-e, -en, -er, -s und endungslos) also vielleicht dauert es einfach länger, aus 5 verschiedenen Möglichkeiten die Pluralform herauszusuchen, als aus 3 verschiedenen Möglichkeiten (-(e)s[des Vaters, des Kindes], -en [des Menschen] und endungslos [der Mutter]) die Genitivform herauszusuchen. Zudem ist die Genitivmarkierung mit –s die am häufigsten vorkommende, während die Pluralmarkierung mit -s eine seltene ist, die im Wesentlichen auf Wörter beschränkt ist, die in gewisser Weise „Ausnahmen“ sind, wie Eigennamen (die Meiers), Abkürzungen/Kurzwörter (die LKWs, die Unis), manche Fremdwörter (die Balkons) und Wörter, die auf einen nicht betonten Vollvokal enden, wie Opas und unsere Eskimos im Beispiel.
Das bedeutet, das Experiment kann bei diesem Ergebnis gar keine Aussagen zur kontextuellen vs. bedeutungstragenden Flexion machen, denn es gibt viel zu viele andere Möglichkeiten, wie dieses Ergebnis zustande gekommen sein könnte.
Aufgabe 2
Normalerweise sagt niemand ist und hat es. Also vermutlich hat der Lehrer is und hades gesagt. Weil das so normal ist, braucht man es in der Transkription nicht zu markieren, sondern kann die besser lesbare Standardorthographie verwenden. Allerdings verhindert diese Schreibung es, dass man zwischen eventuell auch vorkommenden super-korrekt sprechenden Lehrern und eher normal sprechenden unterscheiden kann. Sollte derselbe Lehrer in manchen Passagen is und hades sagen, in anderen aber ist und hat es (z.B. im normalen Gespräch mit der Klasse vs. beim Diktieren einer Aufgabe), dann müsste die Transkription dies auf jeden Fall berücksichtigen.
Aufgabe 3
Gut ist :
- Da es sich um eine Frage handelt, bei der eine sprachliche Norm eine Rolle spielt (das Doppelperfekt gilt als falsch oder unschön, Sick hat es als „Hausfrauenperfekt“ bezeichnet, wohl in Unkenntnis der Tatsache, dass es sich selbst bei Goethe findet), ist es richtig, nicht das eigentliche Thema der Umfrage zu nennen.
- Der Ablenker ist nicht schlecht, vor allem weil wirklich mit einem Dialektsatz begonnen wird, allerdings dürfte man gegen Ende des Fragebogens die Sache durchschaut haben.
- Das offizielle Papier und der Name der Professorin (die hoffentlich gefragt wurde) erhöhen den Eindruck einer seriösen Befragung, trotzdem wird sie nicht zu sehr belästigt, weil ja die eigene Mailadresse der Magisterstudentin angegeben ist.
- Es ist eine Möglichkeit geschaffen, die Ergebnisse der Befragung zu bekommen, ohne die Anonymität aufzugeben – zumindest wenn der Streifen wirklich vor der Auswertung abgetrennt wird. Für heiklere Fragen wäre dieses Verfahren allerdings nicht ausreichend, dann müssten dafür wirklich 2 getrennte Blätter verwendet werden.
Schlecht ist:
- Es gibt zu wenig korrekte Sätze, man kommt schnell auf die Idee, alles müsse falsch sein.
- Insgesamt ist der Fragebogen zu kurz, um wirklich alles genau zu berücksichtigen, was eine Rolle spielen könnte. Für Doppelperfekt und für Doppelplusquamperfekt sollten mindestens 3 Sätze jeweils mit sein und haben als Hilfsverb vorkommen, denn die Akzeptanz ist auch vom Hilfsverb abhängig. Das allein wären schon 12 Sätze, dazu müssten dann mindestens 24 Ablenker-Sätze kommen, also solche, die kein Doppelperfekt oder Doppelplusquamperfekt enthalten, sondern ganz korrekt sind oder andere strittige Formen enthalten.
- Die vorgegebenen Antwortkategorien sind unglücklich gewählt, weil sie 2 Aspekte vermischen. Einerseits geht es um die Beurteilung, was korrektes Deutsch ist und was nicht korrektes Deutsch (besser nicht „falsch“ verwenden, das kann inhaltlich aufgefasst werden, so dass der 2. Satz „Heute ist schönes Wetter“ an einem Regentag mit „falsch“ markiert wird), andererseits darum, ob man etwas kennt und gebraucht. Man kann durchaus etwas gebrauchen, es aber trotzdem für falsch halten.
Aufgabe 4
Die unabhängige Variable ist das Alter der Kinder, Sie brauchen also z.B. Kinder von 2, 3 und 4 Jahren, die abhängige Variable ist die Produktion der Verbformen. Sie könnte 4 Ausprägungen haben:
- nach dem Muster des ähnlichen starken Verbs
- schwach (regelmäßig)
- stark, aber nach einem ganz anderen Muster
- keine verwertbare Antwort (das Kind sagt etwas völlig anderes).
Es gibt ganz viele verschiedene Arten, wie man vorgehen könnte, auf jeden Fall muss man die Kinder dazu bringen, eine Form zu produzieren, bei der man erkennen kann, wie sie das Verb flektieren würden. Eine Möglichkeit wäre z.B., dass man Bilder vorlegt mit 2 Kindern, eins bei einer ungewöhnlichen Handlung, eins zusehend, und dann sagt: „Eva tingt gerade, Maria will nicht mitmachen, sie hat heute schon …..“ und versucht, die Kinder dazu zu bekommen, den Satz zu vervollständigen. Wichtig ist natürlich, dass man nicht noch die Semantik des ähnlichen Verbs in den Satz einbaut, also unglücklich wäre zum Beispiel „Eva tingt im Schulchor, aber Maria hat noch nie gern …………“.
Aufgabe 5
Die Daten sind auf Nominalskalenniveau, Sie können also nur statistische Verfahren für dieses Skalenniveau anwenden.
Aufgabe 6
In Anbetracht der Datenlage geht nur der χ2-Test, die Rohdaten der einzelnen Schüler haben Sie nicht, und „Methode 1“ und „Methode 2“ sind nominalskaliert. Sie können ihn mit dem Taschenrechner rechnen oder vom Computer rechnen lassen. Für den Fall, dass Sie es von Hand rechnen, müsste es so aussehen (erwartbare Werte in Klammer):
Methode 1 |
Methode 2 |
Zeilensumme/ Ecksumme |
|
Gruppe A |
97 (89,29) |
72 (79,71) |
169 |
Gruppe B |
52 (59,71) |
61 (53,29) |
113 |
Spaltensumme/ Ecksumme |
149 |
133 |
282 |
Wir berechnen: χ2 = ∑ ( | beobachtet – erwartet | - 0,5)2 ⁄ erwartet
Das Abziehen von 0,5 in der Formel ist nur bei 4-Felder-Tafeln nötig (Yates-Korrektur), wenn man mehr Felder hat, entfällt es.
Die Summen der Rechenergebnisse für die 4 Felder nach dem Einsetzen in die Formel ergeben also (gerundet): 0.5822 + 0,091 + 0,8706 + 0,9755 = 2,5193
χ2 = 2,5193, was bei einer Vier-Felder-Tafel, also einem Freiheitsgrad, nicht ausreichend ist, der Wert müsste für ein Signifikanzniveau von 0,05 (5 % Irrtumswahrscheinlichkeit) mindestens 3,84 betragen, für ein Signifikanzniveau von 0,01 (1 % Irrtumswahrscheinlichkeit) mindestens 6,64.
Das bedeutet, der Zufall ist nicht ausgeschlossen als Ursache für die gefundenen Unterschiede, wir können nicht sagen, dass Methode 1 besser funktioniert als Methode 2.