プロシジャのアウトプットをダイレクトにいじるのは、あんまやったことないから無理です~!って逃げるところでしたが、ちょっと頑張ってみました。
確かにproc corrかけると、対象変数の相関行列がでてくるんですが、変数多いと、目が滑って見落としちゃうことあります。
まず
data Q1;
A=2;B=1;C=2;D=3;E=9;F=9;output;
A=4;B=2;C=3;D=8;E=2;F=22;output;
A=6;B=1;C=3;D=2;E=13;F=9;output;
A=8;B=4;C=6;D=3;E=23;F=1;output;
A=10;B=5;C=7;D=5;E=8;F=8;output;
run;
適当にデータを作ります。
で、
ods trace on;
proc corr data=Q1;
run;
ods trace off;
とすると
と、いっぱい出てきます。
今回、いじくりたいのは3つめの相関行列の表です。
ods traceつけて実行したので、ログには各アウトプットの情報がでています。
そこから相関行列に該当するものを探します。
(ods tarce onについて詳しくは
みっけ! そこで、テンプレートの箇所をみます。
このテンプレートこそが、解析結果をアウトプットするためのデザイン情報、スタイルシートみたいなもんなんですね。
そこで、テンプレートを特定したら、次にそのテンプレートの中身を展開して確認します
proc template;
source Base.Corr.StackedMatrix;
run;
templateプロシジャでsourceの後に、確認したい先ほどのテンプレート名を指定して実行
ログに以下のようなものがでてきます。
ふむふむ、成程。さっぱりわからん。読めるか、こんなもん。
まあ、GraphTemplateLangage(GTL)やってる方なら知っているかもしれませんが、これはグラフじゃない方ののテンプレートランゲージなんですね。
これをカスタマイズするのか~。まあ頑張って読んでみます。
大切なのは、どこの記述が、アウトプットのどこに紐づいているかを見極めることです。
じっくり見てると、なんとな~く
column (RowName RowLabel) (Matrix) * (Matrix2) * (Matrix3) * (Matrix4);
の箇所が、全体の構造に関係してる気がしませんか?勘で。
さっきのアウトプットと見比べてみると、column(RowName RowLabel)はどうも、縦にA B C D E F、横にA B C D E Fとなっている、アウトプットの一番外側の部分ではないか?と当たりがつきます(強引)。そうすると、次に(Matrix)とあるものは、もしかして相関係数の行列に対応しているのでは?と推測されます(強引)、じゃあ次の(Matrix2)はP値か!
じゃあ(Matrix3)と(Matrix4)はなんなんだ? あ、そうか、corrプロシジャにはたくさんオプションが付けられる!その指定によっては出現する階層じゃないのか!(もはや、こじつけ)
ということがわかります。まあ、詳しくはods関係をじっくり勉強してください。
そして、もう一つさっきのTemplateプロシジャの出力で重要ななのが、NOTEの部分で、このcorrプロシジャの相関行列をだすテンプレートはSASHELPのTMPLISTって中に格納されているよって部分です。このことを心に留めていてください。
さて、実際にこっからテンプレート改造手術を開始する前に下準備
proc format;
/*相関係数の色*/
value rf low--0.7='RED'
-0.7<--0.4='BLUE'
-0.4<--0.2 ='GREEN'
-0.2-<0.2='WHITE'
0.2-<0.4='GREEN'
0.4-<0.7='BLUE'
0.7-<1='RED'
1='WHITE';
/*P値の色*/
value pf low-0.01='RED'
0.01<-0.05='BLUE'
0.05<-high='BLACK';
run;
まあそのまんまですね、相関係数の値によって変わるフォーマット、P値によって変わるフォーマットを先んじて作っておきます。
そしたら
proc template;
edit Base.Corr.StackedMatrix;
column (RowName RowLabel) (Matrix) * (Matrix2);
edit matrix;
cellstyle _val_ as {backgroundcolor=rf.};
end;
edit matrix2;
style={foreground=pf.};
end;
end;
run;
これで手術完了です。
edit Base.Corr.StackedMatrix;は、カスタマイズする元のテンプレート名を指定
column (RowName RowLabel) (Matrix) * (Matrix2);
は、今回はここまでの定義以上は必要ないので、こうしてます
edit matrix;からend;までが、相関係数の部分をいじりますよって意味です。
cellstyle _val_ as {backgroundcolor=rf.}; これはセルの値に基づいて、セルのスタイルを変更してください、背景色はrfフォーマットで定義しますって意味です。
edit matrix2;からも同様で、今度はセル全体ではなく、値の書式のみを変更する書き方です。
そして実行すると、このテンプレートはWORK.templateというところに保存されます。え?SASHELPじゃないの?って思うかもしれませんが、SASHELPのテンプレートをうっかり変な風に変えちゃったら、今後のcorrプロシジャのアウトプット全部変になって大変でしょう?
だからWORKに複製が作られて、そこが改造されるようになってるんです。
で
ods path work.template(update) sashelp.tmplmst;
ods html file='/folders/myfolders/sample.html';
proc corr data=Q1;
ods select PearsonCorr;
run;
ods html close;
です。あ、ちなみにfile=の記述は、なぜかUniversityではこれでhtmlつくらないと、僕の環境でうまくいかなかったのでつけてるだけで、本来いらないです。
リスト出力以外ならods pdf;でもods rtf;でもods htmlでもなんでもいいです。
ods path work.template(update) sashelp.tmplmst;
これは、WORKにある、カスタマイズしたテンプレートがあるかを先に見ろよ、あったらそっち使えよ!って命令です。
結果は
です。相関係数の絶対値が0.7以上ならセルが赤、0.4以上なら青、0.2以上は緑になります。
P値は5%以下なら青字、さらに1%以下なら赤字になります。
カスタマイズしたテンプレートを消す場合
proc template;
delete base.corr.stackedmatrix;
run;
でOKです。
0 件のコメント:
コメントを投稿