| Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu. |
|

Home Multivariate Daten Modellbildung Test von Modellen Kreuzvalidierung |
||
| Siehe auch: PRESS, Validierung von Modellen, Variablenauswahl - Übersicht, Kendall's Tau, Kruskal's Gamma | ||
|
||
KreuzvalidierungAuthor: Hans Lohninger
Obwohl es verschiedenste Arten der Kreuzvalidierung gibt, bleibt das Prinzip
das Gleiche: die Modelldaten werden in zwei sich gegenseitig ausschließende
Mengen aufgeteilt, in eine größere (die Trainingsmenge) und eine kleinere (die
Testmenge). Die größere Datenmenge wird dazu verwendet, ein Modell aufzustellen,
während die kleinere Datenmenge dazu dient, das Modell zu bestätigen, indem
man das Modell auf die kleinere Datenmenge anwendet und die Ergebnisse mit
den tatsächlichen Werten vergleicht. Dieser Prozess wird mit verschiedenen
Untermengen so lange wiederholt, bis jedes Objekt der Datenmenge einmal für die
Testmenge verwendet wurde. Die Größe der Testmenge für jede Wiederholung der Prozedur kann den Bedürfnissen des Benutzers angepasst werden und hängt hauptsächlich von der Größe des gesamten Datensatzes sowie der Zeit und dem Aufwand für die Ausführung der Kreuzvalidierung ab. Es gibt zwei denkbare Extremfälle: (1) die Datenmenge auf zwei gleich große Hälften aufzuteilen; (2) nur ein einziges Objekt für die Testmenge auszuwählen. Die letztere Vorgehensweise wird auch vollständige Kreuzvalidierung genannt und ist generell besser. Um die Leistung einer Methode zu messen, sollte man den PRESS berechnen.
|
||
Home Multivariate Daten Modellbildung Test von Modellen Kreuzvalidierung |
||