1. Proc2. print3. means(๊ธฐ์ดํต๊ณ๋) 3.1 By, Class4. contents5. sort5. freq6. univariate ๋ฌธ7. proc ๋ฌธ์์ ์กฐ๊ฑด์ง์
1. Proc
PROC(procedure, ์ ์ฐจ) ๋ช
๋ น์ด๋ ๋ฏธ๋ฆฌ ์ ์๋ ๋ช
๋ น์ด๋ฅผ ์ ์ฐจ์ ๋ง๊ฒ ์คํํด์ฃผ๋ ๋ช
๋ น์ด ์
๋๋ค.
PROC
๋ค์ ์ฌ์ฉํ SAS ๊ธฐ๋ฅ๋ช
์ ๋ถ์ฌ์ ์ฌ์ฉํ ์ ์์ต๋๋ค.์ถ๋ ฅ ๋ฐ์ดํฐ์์ ๋ณ์๊ฐ ํ๊ธ๋ก ๋์์๋ ๊ฒฝ์ฐ๋ ๋ณด๊ธฐ๊ฐ ์ปฌ๋ผ ๋ ์ด๋ธ๋ก ๋์ด ์๋ ๊ฒฝ์ฐ์ด๊ณ , ์ค์ ๋ณ์๋
์ปฌ๋ผ ์ด๋ฆ(๋ณ์๋ช
)
์ผ๋ก ๋์ด ์์ต๋๋ค.2. print
๋ฐ์ดํฐ ์
์ ๋จ์ ์ถ๋ ฅํ ์ ์์ต๋๋ค.
proc print data=๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ช .๋ฐ์ดํฐ์ ; var ๋ณ์๋ช ๋ณ์๋ช ; run;
ย
proc print data=mysas.subject_test1; var name subject; run;
ย
ย
var๋ฅผ ์ฌ์ฉํ์ฌ ์ค์ ๋ฐ์ดํฐ์์ ๋ณด๊ณ ์ถ์ ๋ฐ์ดํฐ๋ง ์ถ๋ ฅํ์ฌ ๋ณผ ์ ์์ต๋๋ค.
ย
3. means(๊ธฐ์ดํต๊ณ๋)
์ฐ์ํ ์ซ์ํ ๋ณ์๋ค์ ๋ํ ํ๊ท , ํ์คํธ์ฐจ, ์ต๋๊ฐ, ์ต์๊ฐ์ ํ์ํ๋ ๋ฐฉ๋ฒ์
๋๋ค.
proc means data=๋ผ์ด๋ธ๋ฌ๋ฆฌ.๋ฐ์ดํฐ์ ; var ๋ณ์๋ช ; /*ํต๊ณ๋์ด ์๊ณ ์ถ์ ๋ณ์*/ by ๋ณ์๋ช ; /*๋ณ์๋ณ ์ ๋ ฌ ํต๊ณ*/ class ๋ณ์๋ช ; /*์ ๋ ฌํ ํ์ ์๊ณ ๋ณ์๋ณ ํต๊ณ*/ run;
ย
๋ช
์ํ์ง ์์ ๊ฒฝ์ฐ ๋ชจ๋ ์์น์ ๋ํด
๊ธฐ์ดํต๊ณ๋
์ ๊ตฌํฉ๋๋ค.proc means data=jeju.subject_test1; run;
ย
ย
proc means data=mysas.subject_test1; var score; run;
ย
ย
3.1 By, Class
๊ธฐ์ดํต๊ณ๋์ ์ํ ์๋ก์ด Table ์ ์ธํ๊ธฐ
data mysas.subject_score; input id name $9. one two three; datalines; 1 ์ดํธ์ค 92 81 32 2 ์ดํธ์ค 80 95 91 3 ์ด๊ธธ๋ 90 42 42 4 ์ด์คํธ 86 71 41 ; run; proc print data=mysas.subject_score; run;
ย
ย
class์ by ๋น๊ตํด๋ณด์๊ธธ ๋ฐ๋๋๋ค.
by
proc means data=mysas.subject_score; var one; by id; run;
ย
ย
class
proc means data=mysas.subject_test1; var score; class name; run;
ย
4. contents
๋ฐ์ดํฐ์
์ ๊ดํ ์์ธ ์ ๋ณด๋ฅผ ๋ณด์ฌ์ค๋๋ค. ๋ณดํต ๋ฐ์ดํฐ๋ฅผ ๊ฐ๊ณตํ๊ธฐ ์ ์ ๋ณ์๋ค์ด ์ด๋ค ๊ฒ์ด ์๋์ง ํ์ธํ ๊ฒฝ์ฐ ์ฌ์ฉํฉ๋๋ค.
ย
proc contents data=๋ผ์ด๋ธ๋ฌ๋ฆฌ.๋ฐ์ดํฐ์ ; run;
ย
proc contents data= mysas.subject_test1; run;
ย
5. sort
by
์์ ์ ํด์ค ๋ณ์๋ฅผ ๊ธฐ์ค์ผ๋ก ์ ๋ ฌํด์ค๋๋ค.proc sort data=๋ผ์ด๋ธ๋ฌ๋ฆฌ.๋ฐ์ดํฐ์ ; by ๋ณ์; run;
ย
PROC PRINT์์ ๊ทธ๋ฃน์ ์ค์ ํ๋ BY๊ตฌ๋ถ์
์ค๋ฆ์ฐจ์
์์๋๋ก ์ ๋ ฌ๋ผ ์์ด์ผ ํฉ๋๋ค. ๊ทธ๋ ์ง ์์ ๊ฒฝ์ฐ ์๋ฌ๊ฐ ๋ฐ์ํฉ๋๋ค.DESCENDING
: ๋ด๋ฆผ์ฐจ์์ผ๋ก ์ ๋ ฌ์ ํด์ค๋๋ค.ย
proc sort data=๋ผ์ด๋ธ๋ฌ๋ฆฌ.๋ฐ์ดํฐ์ ; by DESCENDING ๋ณ์; run;
ย
proc sort data=mysas.subject_score; by DESCENDING id; run; proc print data=mysas.subject_score; run;
ย
5. freq
freq ๋ฌธ
: ๋น๋ ์กฐํ๋ฅผ ํด์ค๋๋ค.- ๋ถํ ํ๋ฅผ ๊ทธ๋ ค์ค๋ค.
- ๋น๋,๋ฐฑ๋ถ์จ,๋์ ๋น๋,๋์ ๋ฐฑ๋ถ์จ์ ๋ณด์ฌ์ค๋ค.
table
: ์๊ณ ์ถ์ ๋ณ์๋ฅผ ๋ถ์ํด์ค๋๋ค.ย
proc freq data=๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ช .๋ฐ์ดํฐ; table ๋ณ์๋ช ; run;
ย
proc freq data=jeju.subject_test1; table class_; run;
ย
ย
by
: by ๋ณ์๋ณ๋ก ๋ฐ๋ก table ๋ณ์๋ฅผ ๋ถ์ํด์ค๋๋ค. proc freq data=๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ช .๋ฐ์ดํฐ; table ๋ณ์๋ช ๋ณ์๋ช by run;
2์ฐจ์ ๋ถํ ํ
ย
ย
table ๋ณ์๋ช
*๋ณ์๋ช
๋ก ํํํ๋ฉด 2์ฐจ์ ๋ถํ ํ
๊ฐ๋์ต๋๋ค.
ย
proc freq data=mysas.subject_test1; tabel class_*subject; run;
ย
6. univariate ๋ฌธ
Python(Pandas)์ describe ์
๋๋ค.
ํ๊ท , ์ค์๊ฐ, ํ์คํธ์ฐจ, ์ต๋๊ฐ, ์ต์๊ฐ, ์ฌ๋ถ์์, ๋ฐฑ๋ถ์์ ๋ฑ์ ๋ํ ๊ธฐ์ดํต๊ณ๋์ ๋ํ๋
๋๋ค.
์๊ณ ์ถ์ ๋ณ์๋ค์ ํต๊ณ๋์ ์ ๋ถ ์ถ๋ ฅํด์ค๋๋ค.
ย
proc UNIVARIATE data=mysas.subject_test1; var score; run;
ย
ย
7. proc ๋ฌธ์์ ์กฐ๊ฑด์ง์
where ๊ตฌ๋ฌธ์ ์ฌ์ฉํฉ๋๋ค.
proc print data=mysas.subject_test1; where score>=90; run;
ย
ย
ย
ย
5.3.3. SAS์ SQL