SAS: nodupkey & nodup

轉載自:http://blog.sina.com.cn/s/blog_632721090100puep.html


1. nodupkey會把同by variable裏變量有相同值的observation都刪掉。這些observation包括那些與by variable裏變量有相同值,但與剩下變量有不同值的observation。如,
input id1 $ id2 $ extra ;
cards;
aa ab 3
aa ab 3
aa ab 2
aa ab 1
;

proc sort nodupkey data=test3;
by id1 id2;
run;
options nocenter;
proc print data=test3;
run;
Obs    id1    id2    extra


1     aa     ab       3


2. nodup會把那些與by variable裏變量有相同值的observation刪掉,如


data test2;
input id1 $ id2 $ extra ;
cards;
aa ab 3
aa ab 3
aa ab 2


aa ab 1
;


proc sort nodup data=test2;
by id1 id2;
run;
options nocenter;
proc print data=test2;
run;
Obs    id1    id2    extra


1     aa     ab       3
2     aa     ab       2
3     aa     ab       1
但要注意的是nodup只會把相鄰的且僅具有相同by variable變量值的observation刪掉,如
data test1;
input id1 $ id2 $ extra ;
cards;
aa ab 3
aa ab 1
aa ab 2
aa ab 3
;
proc sort nodup data=test1;
by id1 id2;
run;
options nocenter;
proc print data=test1;
run;
Obs    id1    id2    extra

1     aa     ab       3
2     aa     ab       1
3     aa     ab       2

4     aa     ab       3

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章