Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu.

Ausreissertest nach Walsh

J.E. Walsh entwickelte einen nicht-parametrischen Test, um Ausreisser in einem beliebigen Datensatz zu detektieren. Dieser Test erfordert zwar eine große Zahl an Beobachtungen (n > 220 für ein Signifikanzniveau von a = 0.05), kann dafür aber für nicht-normalverteilte Daten angewendet werden. Die folgenden Anweisungen beschreiben die Durchführung des Walsh-Tests für große Stichproben:

Nehmen wir an, dass X1, X2, ... , Xn die Folge der in aufsteigender Reihenfolge sortierten Daten repräsentiert. Falls n<60 ist, darf der Test nicht durchgeführt werdem, falls 60<n<=220, dann liegt das Signifikanzniveau a bei 0.10, bei größerem n (n >220) liegt es bei 0.05.

Schritt 1: Zuerst definiert man die Zahl der möglichen Ausreisser r >= 1.
Schritt 2: Dann berechnet man c = ceil(), k = r + c, b2 = 1/a, und

wobei ceil() die Rundung zur nächst-größeren ganzen Zahl bezeichnet (Beispiel: aus 3.21 wird 4).
Schritt 3: Die r kleinsten Punkte sind Ausreisser (bei einem Signifikanzniveau a), falls Xr - (1+a)Xr+1 + aXk < 0 gilt
Schritt 4: Die r größten Punkte sind Ausreisser (bei einem Sigifikanzniveau a), falls Xn+1-r - (1+a)Xn-r + aXn+1-k > 0 gilt.
Schritt 5: Falls beide Ungleichungen erfüllt sind, sind sowohl die kleinen als auch die großen Werte als Ausreisser anzusehen.


Last Update: 2010-Sep-04