Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Zagadnienia: Populacyjne macierze kowariancji i korelacji – definicje i własności. Metody estymacji macierzy kowariancji i korelacji. Współczynnik korelacji Pearsona i współczynnik korelacji rang Spearmana. Korelacja a niezależność zmiennych.
Treść ćwiczenia: Dla podanego zbioru danych eksperymentalnych:
Obliczyć macierz kowariancji i macierz korelacji;
Wskazać zmienne najbardziej (najmniej) skorelowane i sporządzić ich wykresy rozproszeń;
Zbadać czy (jak) zmieniają się macierze kowariancji i korelacji w poszczególnych klasach;
Utworzyć na podstawie dowolnej zmiennej V z oryginalnego zbioru dodatkową zmienną Z, tak że Z=aV+b i wyznaczyć korelacje i kowariancje zmiennych V i Z;
Zmienić skalę pomiarową rozpatrywanego zbioru (przykładowo pomiary podawane w cm wyrażamy w metrach), i sprawdzić czy (jaki) ma wpływ taka operacja na analizowane macierze;
Wykorzystywane procedury SAS:
PROC CORR {COV SPEARMAN}; {} – opcjonalne
{VAR lista-zmiennych;}
{WITH lista-zmiennych;}
{BY list-zmiennych;}
COV – oblicza macierz kowariancji;
SPEARMAN – oblicza współczynniki korelacji rang Spearmana.
Przykładowe pytania sprawdzające:
1. Na czym polegają różnice pomiędzy macierzą korelacji a macierzą kowariancji?
2. Jeżeli zmienne losowe są niezależne to co możemy powiedzieć o współczynniku korelacji?
3. Ile wynosi współczynnik korelacji zmiennych liniowo zależnych?
4. O czym mówi znak współczynnika korelacji?
5. Przekątne macierzy kowariancji i korelacji zawierają odpowiednio …
6. Czy mogą macierze korelacji i kowariancji być sobie równe ?(Kiedy?)