Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.



Histogramm

Histogramme sind eine effiziente und gebräuchliche Methode, um Verteilungen von kontinuierlichen Variablen zu beschreiben. Im Allgemeinen stellen Histogramme die Häufigkeit des Auftretens einer Beobachtung innerhalb gegebener Intervalle gleicher Breite dar. Histogramme können als eine Art Klassifikation von Daten betrachtet werden. Jeder Datenpunkt wird, abhängig von seinem Wert, in eines der Intervalle sortiert. Das folgende zeigt wie Histogramme berechnet werden.

Eine wichtige Frage ist die Zahl der Intervalle, die für ein Histogramm verwendet wird: wenn die Zahl der Klassen zu niedrig oder zu hoch ist, könnte das Histogramm die Information in den Daten verdecken. Probieren Sie das folgende , um den Effekt der Variation von Intervallgrößen zu sehen. Als Faustregel, wie viele Klassen man am besten verwendet, wird meist einer der folgenden Zusammenhänge verwendet:

nclass~
nclass~ 2
nclass~ 10log10(n)

wobei die letzte Formel für wenige Beobachtungen (<50) ungeeignet ist.

Bei der Darstellung der Histogramme sollte man unbedingt auf Flächentreue achten, da das menschliche Auge leicht zu Fehlinterpretationen neigt, falls die Flächentreue nicht gegeben ist. Außerdem sollte man darauf achten, dass alle Histogrammbalken gleich breit dargestellt werden. Dadurch kann die Häufigkeit direkt der Höhe der Balken zugeordnet werden.

Histogramme sind laut Definition Treppenfunktionen. Eine glattere Alternative zu Histogrammen sind Häufigkeitspolygone.



Last Update: 2008-Feb-29