Mittwoch, 29. August 2012

Mittelwert-Definition und Erklärung von Mittelwerten

In der Statistik versucht man durch Maßzahlen der Stichprobe Verteilungen zu beschreiben.
Zu den Maßzahlen gehören:
  • Lagemaße
  • Streuungsmaße
  • Konzentrationszahlen
  • Maß zu Beschreibung der Schiefe und Wölbung

1.1) Was sind Lagemaße

Lagemaße beschreiben im Wesentlichen, wo die Daten bzw. die Werte der (endlich) konkreten Stichprobe (x1, ….., xn) liegen.


1.2) Unterscheidung der Lagemaße


Lagemaße werden aufgeteilt in folgende Punkte:




1.3) Welche Mittelwerte kann man berechnen?


Man unterteilt die Mittelwerte wie folgt:
  • arithmetische Mittelwert
  • geometrischer Mittelwert
  • harmonischer Mittelwert

Das arithmetische Mittelwert ist wohl das bekannteste und wird auch Stichprobenmittel genannt.
Die Formel zur Berechnung des arithmetischen Mittelwert lautet:

,
hierbei sind alle xi aus dem Raum der reellen Zahlen.

1.4) Ein Beispiel zur Berechnung des arithmetischen Mittel mit Hilfe von Excel:


Wir haben zu einem Artikel auf unserem Blog eine unterschiedlich Anzahl an täglichen Seitenaufrufen.

Um nun das arithmetische Mittelwert zu bestimmen müssen wir alle Seitenaufrufe addieren und durch die Anzahl der Elemente (Seitenaufruf am Tag1 bis Seitenaufruf am Tag 7) teilen.

Dies geht mir Excel sehr einfach:
=Mittelwert(B2:B8)



1.5) Kritik bzw. Problem beim arithmetischen Mittel:

Das Problem beim arithmetischen Mittel ist, dass sie leicht verfälscht werden kann.
In der Mathematik sagt man, sie ist sensibel gegenüber Ausreißer.
Wenn also ein(ige) Werte deutlich größer oder kleiner sind als die anderen Werte, dann wird das Ergebnis vom arithmetischen Mittel schnell verfälscht.


1.6) Ein Beispiel mit Excel dazu: Verfälschung des arithmetischen Mittel: 


Betrachten wir diesmal die Seitenaufrufe pro Woche für unseren Artikel.
Wie man in der Excel Tabelle erkennen kann, ist der Wert in der Woche 4 im Vergleich zu den anderen Werten viel höher.
Wenn wir nun wieder das arithmetische Mittel berechnen (für alle Wochen: "=mittelwert(B2:B9)") dann lautet das Ergebnis:
durchschnittlich haben wir 1005,75 Seitenaufrufe pro Woche.

Dieses Ergebnis ist aber verfälscht durch die Woche 4 (3500 Seitenaufrufe). In keiner anderen Woche sind die Seitenaufrufe größer 1000, aber der Ø soll bei 1005,75 liegen.


1.7) Was kann man also machen?


Um das Problem der nicht robusten Form des arithmetischen Mittel zu lösen, kann man folgendes tun:

Wir könnten einfach die Woche 4 streichen und dann das arithmetische Mittel berechnen, dann würde die Ø-Anzahl an Seitenaufrufen bei 649 pro Woche liegen.
Jedoch wäre das nicht sonderlich gut, denn wenn man nicht 8 Wochen miteinander vergleicht sondern 100 Wochen bzw. wenn man 1000 Daten oder noch mehr Daten miteinander vergleicht, dann hat man nicht nur einen Ausreißer.
Um so größer die Anzahl der konkrete Stichprobe (Anzahl der Daten) ist, um so mehr Ausreißer kann es geben.
Hierbei können die Ausreißer einen sehr kleinen - oder einen sehr großen Wert haben und somit den Mittelwert negativ beeinflussen.

Um auf beiden Seiten (hohe Werte und niedrige Werte) eine saubere Berechnung durchführen zu können, benutzt man das getrimmte arithmetische Mittel:



Diese Form des arithmetischen Mittel ist sehr viel robuster gegenüber Ausreißer.


Ein Excel Beispiel: getrimmtes arithmetischen Mittel

Wir betrachten die Pageviews für einen Zeitraum von 15 Wochen. Diese Seitenaufrufe pro Woche sortieren wir der Größe nach.
Dann berechnen wir wieder das arithmetische Mittel, jedoch nur für die Werte von B4 bis B14.

=mittelwert(B4:B14)

Wie man erkennen kann ist das getrimmte arithmetische Mittel (739,63) geringer als das "normale" arithmetische Mittel (1096.6)
Jedoch ist es genauer, weil wir die Ausreißer den Mittelwert nicht mehr beeinflussen.

In diesen Beispiel ist die Differenz zwischen arithmetischen Mittel und getrimmten arithmetischen Mittel nicht sonderlich groß.
Trotzdem sollte man stets beide Formen des Mittelwerts berechnen. Denn die Differenz kann je nach Beispiel unterschiedlich groß sein und somit könnte man falsche Schlüsse aus dem arithmetischen Mittel ziehen.



Hier geht es zu einem Anwendungsbeispiel: getrimmte arithmetische Mittel

Eine andere robuste Möglichkeit ist die Berechnung des Median, dazu aber zu einem anderen Zeitpunkt mehr.

Hier noch meine Buchempfehlungen zu diesem Thema:

2 Kommentare:

  1. Das ist Stoff aus´m 1 Semsester eines Bwl Studenten auf der FH!
    Nix besonderes also.. reine Statistik.

    AntwortenLöschen
    Antworten
    1. Hi Anonym,

      das ist doch gut wenn du diesen Stoff im ersten Semester gelernt hast. Es gibt aber Menschen die noch nicht im ersten Semester einer FH oder UNI waren bzw. auch nie sein werden. Denkst du nicht, dass es diese Menschen evtl. helfen würde zu wissen was ein getrimmtes arithmetisches Mittel ist?
      Ich verwende diesen Begriff ab und an in anderen Beiträgen (so kann ich dann für meine Leser diese extra Infos anbieten)

      Trotzdem danke für deinen unbekannten Besuch :-)

      Löschen