Instrukcja do laboratorium z przedmiotu
Metody Wielowymiarowej Analizy Danych
Zagadnienia: Trzy style czytania danych z zewnętrznego pliku: listowy (list input), kolumnowy (column input) oraz wykorzystujący informaty. Wybrane informaty; mieszanie stylów wczytywania danych; bardziej skomplikowane sytuacje (jedna linia – wiele obserwacji, wiele linii – jedna obserwacja, czytanie tylko częsci pliku). Opcje wyrażenia INFILE.
Informaty (uwaga na kropkę):
– znakowe: $informatw. (np: $CHARw. $HEXw. $w. )
– numeryczne: informatw.d (np: COMMAw.d PERCENTw. )
– daty: informatw. (np: DATEw. MMDDYYw. )
Opcje wyrażenia INFILE:
– FIRSTOBS=n – umożliwia rozpoczęcie wczytywania danych od linii nr n;
– MISSOVER – w przypadku napotkania końca linii nie przechodzimy do następnej linii,
wszystkie pozostałe zmienne obserwacji przyjmują wartość brakującą;
– PAD – uzupełnia wszystkie czytane linie spacjami do maksymalnej dlugości linii (domyślna długość 132);
– DLM – wykorzystywane do zmiany domyślnego separatora (np: DLM=’,’ oznacza przecinek jako separator) ;
Przykładowe programy SAS:
DATA lab_2; /* Styl kolumnowy */
INFILE 'c:\data\kolumny.txt’ FIRSTOBS=2; /* Opuszczamy pierwszą linię */
INPUT nazwa $ 1-20 ilosc 21-25 wartosc 30-39;
RUN;
DATA lab_2; /*Wykorzystanie informatów */
INFILE 'c:\data\inne.txt’;’
INPUT nazwa $20. ilosc 3. +2 data MMDDYY8. (kwota1 kwota2 kwota3) (10.2);
/* +n oznacza przesunięcie o n znaków */
RUN;
DATA lab_2; /* Mieszanie stylów wczytywania danych*/
INFILE 'c:\data\inne.txt’;’
INPUT nazwa $ 1-20 ilosc kraj $ cena @50 wartosc COMMA10.;
/* @n oznacza przeskok do kolumny numer n */
RUN;