Tröten statt tweeten: Kommt auf unsere Mastodon-Instanz linguisten.info.
alexa_x > 23.06.2011, 23:28:12
Sebastian > 24.06.2011, 10:36:44
janwo > 24.06.2011, 11:32:21
(23.06.2011, 23:28:12)alexa_x schrieb: Aber: Bei der Anzahl an Sätzen, inkludiert man da üblicherweise nur vollständige Sätze? Oder auch Satzfragmente wie z.B. "5 Foods to never eat" oder "Over 100.000 Australians helped each year"?
(23.06.2011, 23:28:12)alexa_x schrieb: Es scheint, es würde also Sinn machen auch unvollständige Sätze zu inkludieren. Aber was ist mit allein stehenden Wörtern? Eine Werbung für Haarglätter und ähnliche Produkte besteht z.B. hauptsächlich aus einzelnen Wörtern bzw. Wortgruppen, die nicht syntaktisch verbunden sind: "total style", "MAKE OVER" "curl", "crimp", "straight"... Sollte ich jedes dieser Wörter (bzw. Wortgruppen) als eigenen Satz werten?
(24.06.2011, 10:36:44)Sebastian schrieb: Mal davon abgesehen, dass in wahrscheinlich niemand so genau weiß, was ein "Satz" ist,oder was ein "Wort" ist. Auch das ist ja nicht gerade einfach zu definieren. Wobei – wenn es nur um Printanzeigen geht – man vermutlich mit den orthographischen Kriterium ("das was zwischen zwei Leerzeichen steht") schon hinreichend weit kommt.
alexa_x > 27.06.2011, 13:51:13
Zitat:Das arithmetische Mittel ist übrigens nicht unbedingt das beste Maß, das man nehmen kann. Es ist nämlich sehr empfindlich für Ausreißer. Wenn z.B. fast alle Äußerungen 5 Wörter lang sind, aber dann gibt es auch eine, die 200 Wörter lang ist, verändert das deinen Mittelwert sehr stark, obwohl es nur von einem einzigen Fall abhängt. Der Median ist für solche Ausreißer viel unempfindlicher. Dabei werden alle Fälle der Größe nach angeordnet und der Median ist dann der Fall, der genauso viele Fälle vor sich wie nach sich hat