| Grundlagen der Statistik enthält Materialien verschiedener Vorlesungen und Kurse von H. Lohninger zur Statistik, Datenanalyse und Chemometrie .....mehr dazu. |
|

Home Multivariate Daten Modellbildung PCA Hauptkomponentenanalyse |
||
| Siehe auch: Eigenvektoren und Eigenwerte, PCA - Loadings und Scores, Anwendungsbeispiel der PCA: Klassifikation von Wein, Faktorenanalyse | ||
|
||
HauptkomponentenanalyseAuthor: Hans Lohninger
Das Problem bei multivariaten Daten ist, dass sie nicht zweidimensional, also auf Papier oder dem Computerbildschirm, dargestellt werden können. Für mehr als zwei Dimensionen müssen wir die Daten auf eine Ebene projizieren. Diese Projektion ändert sich mit ihrer Richtung; oder mit anderen Worten gesagt, das projizierte Bild ändert sich, wenn die Datenpunkte im n-dimensionalen Raum gedreht werden. Es stellt sich nun die Frage, wie eine Rotation der Daten (oder der Achsen - was fast dasselbe ist) gefunden werden kann, die ein Maximum an Information im projizierten Bild darstellt.
Der oben beschriebene Prozess wird als Hauptkomponentenanalyse (engl. principal component analysis, PCA) bezeichnet und resultiert in einer Rotation des Koordinatensystems in einer Art und Weise, dass die Achsen ein Maximum an Streuung entlang ihrer Richtung aufweisen. Diese vereinfachte Darstellung kann mathematisch als so genanntes Eigenwertproblem aufgefasst werden. Die Eigenvektoren der Kovarianzmatrix bilden die Hauptkomponenten. Die korrespondierenden Eigenwerte weisen darauf hin, wie viel Information in den einzelnen Komponenten enthalten ist. Das folgende interaktive Beispiel zeigt einen dreidimensionalen Datensatz und die korrespondierenden Hauptkomponenten. Beachten Sie, dass die Hauptkomponenten orthogonal zueinander sind und die Korrelation zwischen zwei beliebigen Komponenten null ist.
|
||
Home Multivariate Daten Modellbildung PCA Hauptkomponentenanalyse |
||