取っ掛かりとしてちょうどいいかもしれない医療統計学においてのSAS入門
SASを勉強していたのである。最近では統計解析ソフトとしてはR言語やSPSS、Pythonなどが主流になっていると思われているが、医療統計学としてはFDAが採用しているということでまだSASが主流となっている。
僕はかつてSASで医療統計学をしていたが忘れてしまったので、再び思い出すために勉強を始めた。SASは1ライセンスでも相当の額がし、また日本語文献もほとんどないため相当マイナーな言語であるが、前述のように統計解析の結果を担保するという意味合いでデファクトスタンダードとなっているため並行して勉強しようとしていた。
幸い最近ではSASもアカウントさえ作れば無償で学習できるので、これを使って勉強をしていた。
仮想OS上で起動させ、ブラウザ上での操作となるがGoogleChromeでは動かない…なぜかなと思ったらlocalhostがアドブロックに引っかかっていたという単純ミスを直しながら、早速この本に従って動かしてみることにした。
オーム社からダウンロードデータとしてエクセルファイルを引っ張りSASにデータをインポートしようとしたが早速動かない。ダウンロードデータはこちらである。
『統計を知らない人のためのSAS入門 Ver.9.3対応版』|書籍連動/ダウンロードサービス|Ohmsha
どうもSASはUTF-8以外ではインポートできないようで、Shift-JISではどうも上手くいかなかったようだ。しかも僕の環境ではExcelがないときたもんだ(ただWPS Spreadsheetsはあったが)。
インポートするためにCSV形式で一旦保存し、エディタ(サクラエディタを使用)でShift-JISからUTF-8に変換、そこでやっとこさインポートすることが出来た。
そしてこんな感じのスクリプトをちょいと書いてみた。
その結果がこれ!この行数でこれだけの統計量!!html・PDF・rtf出力も出来ますぜダンナ!
SASのいいところとしてはこのあたりが挙げられるが…
- FDA御用達ブランドなので医療統計学では最も多く使われている(推定・検定結果をSAS社が担保していると言い換えても良い)
- 簡単なスクリプトで膨大な統計量を出してくれる
- (最近であれば)無償で学習することが出来る
- (英語が読めれば)リファレンスは豊富である
欠点としてはめちゃくちゃある!学習しづらい!!