SAS求子集

前几天在微信群里看到一个问题:求一个数组的子集。SAS中实现排列的方法有多种,最易懂的方法应该是PROC SUMMARY以及CALL ALLCOMB,两种方法的代码在这里。下面介绍一个DATA步一步到位的方法:

data subsets;
  array set1[*] $ a b c d e ('a', 'b', 'c', 'd', 'e');
  array set2[*] bin1-bin5;
  array set3[*] $ ele1-ele5;
  do i=0 to dim(set1)-1;
    set2(i+1)=2**(dim(set1)-(i+1));
  end;
  do j=0 to 2**dim(set1)-1;
    call missing(of ele:);
    do i=1 to dim(set1);
      if band(j, set2(i)) then set3(i)=set1(i);
    end;
    SUBSETS=cats(of ele:);
    keep SUBSETS;
    output;
  end;
run;

简单说下上面方法的思路,我们知道一个具有n个元素的集合的子集个数是2的n次方,因为每个元素只有出现和不出现两种情况。首先将数组元素转换成二进制值,‘abcde’对应的值为‘00011111’,各元素对应的值分别为:2的4次方16,2的3次方8,2的2次方4,2的1次方2,2的0次方1。然后用函数BAND将数字0-31(0代表空集)分别和各元素做位运算,返回结果为真则将元素值赋值给新的数组,最后将新数组连接起来即为子集。

曾宪华 /
本文采用 署名-非商业性使用-相同方式共享 3.0许可协议 属于 程序人生 分类, 被贴了 PROC SUMMARY CALL ALLCOMB BAND 书签

上一篇 SAS领先函数功能的实现
下一篇 SAS矩阵重组