Übung - Entwurf eines Datensatzes mit Ausreißern
Author: Hans Lohninger
Das Erkennen von Ausreißern ist wichtig, aber manchmal auch recht
schwierig. Um Erfahrung mit Ausreißern zu sammeln, sollten Sie zwei Datensätze
entwerfen, die folgende Eigenschaften aufweisen:
Datensatz 1: |
200 Werte, normalverteilt, keine speziellen Maßnahmen gegen
Ausreißer; (Verwenden Sie die Funktion "Gauß" vom DataLab -Befehl Math/Transformation/Single
Formula, um den Datensatz zu entwerfen.) |
Datensatz 2: |
ca. 200 Werte, nach rechts asymmetrisch; (Hinweis: Verwenden Sie
quadrierte Daten einer Normalverteilung mit einem Mittelwert von null, um
die asymmetrischen Daten zu erzeugen.) Ändern Sie zwei Werte dieses
Datensatzes so, dass einer dieser Werte aus der
+/-2.5-Sigma-Reichweite herausfällt, aber innerhalb der
+/-4-Sigma-Reichweite verbleibt, und der andere aus der
+/-4-Sigma-Reichweite herausfällt. |
Wenden Sie den variance/iqr-Ausreißer-Test des DataLab an und erstellen Sie eine Liste der Ausreißer.
Bitte beantworten Sie die folgenden Fragen:
- Bei wie vielen Werten des Datensatzes 1 haben Sie erwartet, dass sie aus
dem 2.5-Sigma-Bereich herausfallen und wie viele Werte lagen tatsächlich
außerhalb dieser Grenzen?
- Entfernen Sie die Ausreißer des Datensatzes 1, die außerhalb des
2.5-Sigma-Bereichs liegen, und wiederholen Sie den Test. Was ist das Ergebnis?
Ist es richtig, Ausreißer durch eine schrittweise Vorgehensweise zu
eliminieren?
- Vergleichen Sie die Ergebnisse des 2.5-Sigma-Tests mit denen eines Tests,
der auf dem Interquartilsabstand beruht. Erklären Sie den Unterschied in
der Empfindlichkeit.
Sie können jetzt direkt zum DataLab gehen, um mit den Daten zu experimentieren.
|