У меня есть такой набор данных
ACC two three ...
124 12 a
124 14 a
32 129 a
32 12 b
48 1 c
Я хотел бы сохранить первый ACC, т.е. удалить дубликаты на основе второго столбца.
я пробовал с
Data ...;
Set ... ;
By ACC two;
ACC=first.ACC;
keep ACC
two
three;
Run;
Однако у меня все еще есть дубликаты. Можете ли вы сказать мне, где я не прав?
Желаемый результат:
ACC two three ...
124 12 a
32 12 b
48 1 c
который отсортирован по ACC и два. Поэтому я должен выбрать учетную запись с наименьшим значением во втором столбце.
Я думаю, это то, что вы хотите
data have;
input ACC two three $;
datalines;
124 12 a
124 14 a
32 129 a
32 12 b
48 1 c
;
proc sort data=have;
by ACC two;
run;
data want;
set have;
by ACC two;
if first.ACC;
run;
Что вы подразумеваете под «на основе второго столбца»?