ビューの生成コードを出力するdescribeについて、SQLビューとデータステップビューだと方法が違うから気を付けてって話

さて、以前、SASのビューについて説明したことがありました。

「SASのテーブルビュー(view)について」
http://sas-tumesas.blogspot.jp/2013/12/sasview.html


おさらいとして、

data Q1;
 do X= 1 to 10;
output;
 end;
run;

というデータセットが実体としてあった場合、
Xが偶数のもののみに絞るビューは、以下の2種類の方法で書くことができます。

proc sql noprint;
 create view V1 as
  select *
from Q1
where mod(X,2) = 0;
quit;


data V2/view=V2;
set Q1;
where mod(X,2)=0;
run;











SQLプロシジャのcreate viewか、dataステートメントのviewオプションいずれで
作っても、結果作成される2つのビューの挙動は同じです。

しかし、例えば、contentsプロシジャでビューを見てみると

proc contents data = V1;
run;
proc contents data = V2;
run;

V1の方は





エンジン (ENGINE)           SQLVIEW

とでて、
V2の方は





エンジン (ENGINE)           SASDSV

となって、ビューはビューでも一応種類が違うことがわかります。
要するに、ビューが参照されるときに内部的に実行されるコードが、データステップなのか
SQLなのかってことですね。

この違いについて、ビューのユーザーは基本的に特に何も意識せずともいいのですが、少しだけ
注意があります。

それは、そのビューがどういった定義で生成されたものなのかを確認するとき、
SQLビューに対しては

proc sql;
describe view V1;
quit;

としなければならず、
SASデータセットビューに対しては

data view=V2;
   describe;
run;

としなければならないというルールです。

例えばSQLビューに対して

data view=V1;
   describe;
run;

とすると
ERROR: ビュー WORK.V1 は壊れているか、
       または DATA ステップビューではありません。

と弾かれ、逆にSASデータセットビューに対して
proc sql;
describe view V2;
quit;
とすると
WARNING: WORK.V2 は SQL ビューではありません
と弾かれます。

この、スタンドはスタンドでしか攻撃できないみたいなルールについて
知っていればどうってことないのですが、知らない場合、
特にデータセットビューは知ってるけどSQLビューって何?みたいに片方しか把握してない
メンバーが混在して仕事をする時に、問題になったという体験談を聞いたことがあります。
なんか、てっきり壊れてると思って、他の人が作ったビュー、全部消しちゃったとかがマジであったそうです。
(ビューうんぬんというよりかは、自分が作ってないものを無断であっさり消せちゃう度胸が凄いと思いますが…)

できればビューの作成法は統一した方がいいですし、性質上、1ステっプでの表現力が高いSQLの方が
ビューを作るうえでは優位性があると思ってますが…。

さて、最近メールで「最近あまり更新されませんが、なんかありましたか?心配です」という
heart-warmingなメッセージから「将棋見に行ったりするのにかまけてブログ更新頻度落とすんじゃねぇよ!」
というどちらかというとhurtfulなメッセージまでいただきました。

いや、すみません。
ただ、純粋にネタが枯渇してきたというのが実情なのです。まだSAS歴4~5年程度なので底がそんなに深くないんです。
まあしばらく、色々試したり勉強したりしてネタのストックが溜まるまで、低頻度で気ままに更新させていただきます。(まあ、だいたい、データステップをネタにして、月30-40記事も更新してたっていうのが、ちょっと頭おかしいですよね)


0 件のコメント:

コメントを投稿