Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Zagadnienia: Sortowanie i wypisywanie danych (SORT, PRINT), wizualizacja danych (proste wykresy dwuwymiarowe – PLOT, histogramy i wykresy kołowe – CHART, wykresy trójwymiarowe – G3D); tablice częstości (FREQ), proste statystyki (MEANS, UNIVARIATE).
Wykorzystywane procedury SAS:
PROC PRINT;
{VAR zmienna_x zmienna_y …;}
{TITLE 'Tytul’;}
{TITLE# 'Tytul w linii numer '#’;}
{FOOTNOTE 'Stopka’;}
PROC SORT {DATA=zbiór_danych_SAS} {OUT=wyjściowy_zbiór_danych_SAS}
BY zmienna_x {zmienna_y};
PROC PLOT {DATA=zbiór_danych_SAS } {VPERCENT=procent} {HPERCENT=procent}; {ew. GPLOT}
PLOT zm_y*zm_x1{=’symbol1′} {zm_y*zm_x2{=’symbol2′} …};
PROC CHART; {lub GCHART}
VBAR zmienna {/ opcje}; {lub HBAR, BLOCK, PIE}
PROC UNIVARIATE {PLOT} {NORMAL}; /* PLOT – 3 wykresy, NORMAL – test normalności */
{VAR lista_zmiennych;}
{BY zmienna;} /* należy pamiętać o wcześniejszym posortowaniu danych */
Przykładowe programy:
PROC PRINT DATA=lab_3;
TITLE 'Wypisujemy wszystkie zmienne!’;
RUN;
PROC PRINT;
VAR imie wzrost;
WHERE wzrost>180 AND waga>80;
TITLE 'Tylko imię i wzrost, gdy wzrost>180 i waga>80′;
RUN;
PROC SORT DATA=lab_3 OUT=p_sort
BY plec;
PROC PRINT DATA=p_sort;
BY plec;
RUN;
PROC PLOT DATA=lab_3;
PLOT wzrost*waga / HAXIS= 120 140 160 180 200
VAXIS= 50 to 100 by 10;
TITLE 'Wzrost w funkcji wagi’;
FOOTNOTE 'Studenci III roku informatyki’;
RUN;
PROC PLOT;
PLOT wiek*wzrost=’x’ wiek*waga=’*;
RUN;
PROC PLOT HPERCENT=50;
PLOT wiek*wzrost;
PLOT wiek*waga;
RUN;
PROC CHART;
VBAR wzrost; /* VBAR – histogram pionowy, HBAR – poziomy, BLOCK – blokowy, PIE – kołowy */
RUN;
PROC CHART DATA=lab_3;
BLOCK wzrost / MIDPOINTS=150 160 170 180 190
GROUP=plec; /* lub SUBGROUP=plec */
RUN;