Hallo ihr Lieben,
vielleicht könnt ihr mir helfen, meinen Knoten im Kopf zu lösen. Ich stehe nämlich auf dem Schlauch, welchen statistischen Test ich anwenden soll.
Zu meinem Fall und meinen Daten: ich habe 5 Korpora, alle mit ca. 50.000 Worten gefüllt. Nun soll es darum gehen, ob bestimmte semantische Felder in bestimmten Gattungen häufiger vertreten sind, als in anderen und sich somit ein gewisser "Trend" zeigt (Im Sinne, dass in Gattung x beispielsweise ein Themengebiet deutlich repräsentierter ist, als in den anderen)
Als Beispiel:
Die Anzahl der Worte, die zum semantischen Feld "Natur" gehören, kommen im 1. Korpus
211 mal vor, im 2. Korpus
448, im 3. Korpus
334 mal, im 4. Korpus
223 mal und im 5.
317 mal.
Nun sagen natürlich die rohen Zahlen recht wenig aus. (Auch reicht es glaube ich nicht auszurechnen wie viel Prozent das semantische Feld "Natur" im jeweiligen Korpus ausmacht um diesen Prozentualen Anteil zu vergleichen)
Nun bin ich jedoch absolut verwirrt, welchen statistischen Test man inwiefern darauf anwendet. Meine Recherche hat eher zu noch mehr Verwirrung und Unsicherheit geführt.
Ich danke euch für eure Hilfe!
Liebe Grüße ♥