Entschuldige die späte Antwort -- da es sich aber offenbar nicht um ein konkret-aktuell-dringliches Problem handelt, kannst du hiermit vielleicht trotzdem etwas anfangen. Mir war jetzt auch nicht so 100%ig klar, was genau das Problem ist.
Denke die Sache von der anderen Seite aus: Korpusarbeiten unterscheiden sich im Prinzip überhaupt nicht von nicht-korpusbasierten Arbeiten (wie
@thf schon gesagt hat: Forschungsfrage, Hypothese, Überpfürung -- am nächsten dran sind vergleichbare empirische Herangehensweisen, wie experimentbasierte Arbeiten). Eine sinnvolle Frage, die sinnvoll mit Korpusdaten überprüft werden kann, lässt sich auch immer in eine Hypothese/Frage („Wenn X, dann Y“) überführen. Korpusarbeiten sollten (und können!) kleine, sehr genau eingrenzbare Fragestellungen haben -- auf allen Fachgebieten, auf allen Beschreibungsebenen. Damit sind sie meist auch deutlich einfacher zu bearbeiten, als reine theoretische Arbeiten. Wie thf schon gesagt, schau dir doch mal Artikel aus den genannten Zeitschriften an.
Korpusdaten können im Prinzip auf zwei grobe Arten der Beantwortung dienen: illustrativ (thf.s „Beispielspender“) und korpusbasiert bwz. corpus-driven (der Unterschied zwischen basiert und driven ist etwas schwerer zu sehen, tut momentan aber nichts zur Sache). Letztere Herangehensweise ist das, was ich jetzt mal wertfrei „echte“ Korpusarbeit nennen würde, nämlich die systematische Beschreibung und Modellierung von Verwendungsmustern eines sprachliches Phänomen. Die illustrative Methode sucht sich eher unsystematische Beispielsätze (statt sie sich z.B. auszudenken, > Introspektion) zu Verdeutlichung des Arguments. Weshalb ich das eine als „echte“ Korpuslinguistik bezeichne, liegt daran, dass sie „systematisch“ nach Mustern in den Daten sucht — ob das alle Datenpunkte innerhalb eines Korpus beinhaltet oder, z.B. aufgrund der Anzahl der Datenpunkte ein sinnvolles randomisiertes Sample — spielt dafür keine grundlegend entscheidende Rolle.
Anwendungsgebiete? Alle Ebenen! Am augenscheinlichsten natürlich auf der lexikalischen, morphologischen, morphosyntaktischen oder syntaktischen Ebene (da ich Semantik als all diesen Ebenen inhärent vorhanden ansehe, erwähne ich das jetzt mal nicht...) für kernlinguistische Disziplinen, sowie auf der Seite der Text- und Diskursanalyse natürlich in größeren Texteinheiten.
Umfang? Tja, ist das nicht ein Problem, was alle immer zu haben scheinen? Was du beschreibst,
(18.12.2014, 14:59:52)FlorianAir schrieb: Untersuchungsfelder gibt es viele. Nehmen wir bspw. Wortbildungen.
Wie soll anhand Wortbildungen eine ausführliche schriftliche Arbeit entstehen?
Auf Erwähnungen, dass Wort x,y,z mit Suffix a,b,c besteht, ist schnell Schluss ?
Wenn du nur erwähnst, dass Wort x, y, z mit Suffix a, b, c auftritt ist in der Tat nach einem Absatz Feierabend. Aber das ist auch keine Korpuslinguistik bzw. nur eine extrem oberflächliche Deskription — denn es sagt ja nichts interessantes über ein sprachliches Phänomen. Die Aufgabe der Linguistik ist ja, zu erklären, wann X mit A auftaucht und wann mit B und ggf. warum. Da fängst du dann also an zu graben, was bisher Menschen gesagt haben, und ob sie Vermutungen angestellt haben, wann welches Suffix mit welcher Basis zusammen auftritt.
Hier haben wir uns mal über die Adjektivendungen im Englischen unterhalten.
Die Stärke der „echten“ Korpuslinguistik ist dann natürlich, dass sie sich viele Datensätze ansieht und sich ihre Schlussfolgerung nicht aus isolierten (oder auch „illustrierten“) Einzelbeispielen speist. Wie viele Datenpunkte in eine Analyse eingehen, kann man nicht per se sagen. Je nach Frage ist schon nach 20-30 Korpusbeispielen ein stabiles Muster erkennbar. Wichtig ist natürlich grundsätzlich, dass diese 30 Beispiele entsprechend unvoreingenommen ausgewählt wurden (also sinnvoll „randomisiert“ sind).
Ein Literaturhinweis, zum Einstieg in die Denkweise der korpuslinguistischen Mustererkennung:
Sinclair, John. 1991.
Corpus, concordance, collocation. Oxford: Oxford University Press.
Wenn du also deine Frage erläutert, Motivation beschrieben, Literatur gesichtet, Hypothese entwickelt, Korpus & Methode beschrieben, Daten ausgewertet und all das im Rückbezug auf deine Ausgangsfrage gesetzt hast, dann wirst du um mehr Platz betteln, vertrau mir!