SQL2005 算术、字符运算 VS SAS9 的算术、字符运算

80酷酷网    80kuku.com

  sql2005|运算

由于SIN函数计算比较耗CPU,也比较经典,故分别实现1千万次SIN运算做比较

  sql2005代码:
   declare i int;
   declare x float;
   set i=1;
   while i<=10000000
   begin
    set x=sin(i);
    set i=i+1;
   end;
   go 
   
   耗时:26秒
  
  sas DATA步代码 :
   data _null_;
   length i x 8.;
   i=1;
   do i=1 to 10000000;
    x=sin(i);
   end;
   run;
  运行结果:
  NOTE: “DATA 语句”所用时间(总处理时间):
        实际时间         1.72 秒
        CPU 时间         1.70 秒
   耗时不到2秒
 
 
再对字符进行比较,我选择替换字符串做比较,也是分别实现1千万次进行字符串替换运算做比较
 SQL代码
   declare i int;
   declare str varchar(50);
   declare tarStr varchar(50);
   set i=1;
   set str='This is my Test!';
   while i<=10000000
   begin
    set tarStr=replace(str,'my','My');
    set i=i+1;
   end;
   print tarStr;
   go  
  
  运行结果:耗时2分24秒
  
 SAS DATA步代码
  
  data _null_;
  length i 8.;
  length str tarstr $50.;
  str="This is my Test!";
  i=1;
  do i=1 to 10000000;
   tarstr=tranwrd(str,"my","My");
  end;
  put tarstr;
  run;
 
 运行结果:耗时不到9秒  
 NOTE: DATA statement used (Total process time):
       real time           8.09 seconds
       cpu time            8.09 seconds
  
 
初步总结:
 进行一千万次SIN运算时,SQL2005耗时26秒,SAS不到2秒,差不多相差13倍
 进行一千万次字符替换运算时,SQL2005耗时144秒,SAS不到9秒,差不多相差16倍

可以看出,SAS的数据处理能力可以说是超强,在这方面可以说任何当前数据库都不能相比
如果不是由于SAS本身产品的限制,说不定早就在中国市场上流行了

:) 如果有人想把SAS做的ETL转为用SQL2005做ETL时,可要考虑客户的感受了,想想如果一下子由原来的十几天的数据加载变成几个月的数据加载,你就头疼把;当然如果只是小数据量加载之间的转换,还是没问题的

比较有意思的是,SAS的MERGE操作一直以来都是要求输入的数据要先按指定字段进行排序才能MERGE,现在SQL2005提供的MERGE组件也有了这样的要求,有点像终于找到党组织的感觉了



分享到
  • 微信分享
  • 新浪微博
  • QQ好友
  • QQ空间
点击: