見出し画像

SASユーザー総会2023に参加してきた

分析屋の藤島です。
私はお盆前から約1か月間、9月末から始まる臨床解析の案件のために社内のSAS研修に取り組んできました。

SAS研修中にSASユーザー総会というものを知り、参加してみたいと思い、案件上長に相談したところ、すぐに許可が出たので参加してきました。

今回はSASユーザー総会についてまとめました。
振り返りのところでは普段の業務にも意識していきたいことを書いたので、ぜひ最後まで読んでいただけると幸いです。


SASユーザー総会とは

SASユーザー総会とは、SASの活用法や同じ研究分野での有効なSASの使い方など、ユーザー同士でのコミュニケーションを目的とし、参加することによってユーザー同士の情報交換や交流の場を持つことができる学会のようなものです。

プログラムの内容はSASを用いたデータ加工、集計、可視化、シミュレーション、ツール開発事例などがあり、SASユーザーはもちろん、SAS初心者でも楽しめるような内容がありました。

SASユーザー総会2023

補足:そもそもSASとは?

そもそもSASとは何か知らない方もいると思います。SASとはアメリカにあるSAS Institute社が開発した統計解析を行うためのプログラミング言語です。
同じようなことができるプログラミング言語はR、Pythonです。これら2つの言語はみなさんも馴染みがあるのではないかと思います。RやPythonでもSASと同じことができるなら、わざわざSASを使う必要がないと感じる方もいるかもしません。SASはRやPythonと比較するとセキュリティ面での信頼性が高いため、医療や金融などで使用されています。

聴講したプログラムについて

SASユーザー総会の開催期間は2日間ですが、1日目だけ参加してきました。
聴講したプログラムについて簡単に紹介していきたいと思います。

前処理大全SASバージョン

前処理大全【データ分析のためのSQL/R/Python実践テクニック】という書籍に書かれている内容をSASで前処理を書くならどうするのか、でAwesomeな書き方とは何かを発表者目線で説明がありました。負荷を減らすにはどうコードを書けばよいのかを事例を用いて説明されており、今までそういった視点がなかったため、勉強になりました。


SASのSGPLOTプロシジャを用いたデータ可視化入門

SGPLOTプロシジャの詳細な使用方法と機能に焦点を当てて解説する。SGPLOTの全体的な概要とその主要な特徴やオプション、棒グラフ、折れ線グラフ、ヒストグラムなどの使用頻度の高いグラフの描画方法について解説がありました。概要から詳細までバランスよく資料に落とし込まれており、弊社のSAS研修ではデータ可視化について学ばなかったため、時間がある時に勉強したいと思いました。

SASにおけるデータ処理の基礎 複数データの結合と構造転換

データの結合や構造転置といったデータハンドリングの基礎部分をPDV上で行われている処理を解説しながら、実用的なコードと陥りがちな失敗事例について紹介がありました。PDV上で行われる処理と出力結果を1ステップずつ解説されており、結合や構造転置の仕組みについて理解を深めることができました。

※PDVとはSASのデータセットに出力するための処理を行う領域のことです。

アダプティブ臨床試験の動作特性を測るシミュレーションの実践

アダプティブデザインとは臨床試験に参加した被験者の蓄積されたデータに基づいて、被験者の数などを変更することをあらかじめ決めている試験のことです。

この発表ではアダプティブデザインを立案する場合に求められる動作特性を評価するためのシミュレーションについて、その方法と手順、シミュレーションで評価すべき指標とその結果のまとめ方について、まとめた内容の報告がありました。

アダプティブデザインについて知らない人でも理解できるような内容になっていましたが、ドメイン知識や統計知識が不足していたため、難しかったです。

※これ以降が本当に難しかったです。。。

治療群の選択を伴うアダプティブデザインの動作特性の検討-事例に基づくシミュレーションの実践-

治療群の選択を伴うアダプティブデザインについて、事例に基づき臨床シナリオを複数設定し、SASのシミュレーションにより動作特性を検討した結果を報告がありました。
実際のプログラムについてWeb上からダウンロードできるとのことでしたので、時間見つけて実行していきながら理解を深めていきたいと思います。

第1段階と第2段階で異なる2値評価項目を用いたアダプティブシームレスデザインに対する仮説検定法の実装

第1段階と第2段階で異なる2値評価項目を用いたアダプティブシームレスデザインに対して、治療群と対照群の治療効果を比較するための仮説検定法の実装方法について紹介がありました。久しぶりに難解な数式と、統計用語のオンパレードで発表を聞いているときは内容の理解が全然追いつかなかったです。

振り返り

どんなプログラミング言語でも最初はとにかく実行できればOKというマインドで、コードを書く方が多いと思います。研修や自己学習などで理解するのが目的であれば、全然問題ないと思います。
ただしデータ量が多くなってきた場合、その分負荷がかかってしまうことになります。
負荷がかかると最悪の場合、急にソフトウェアが落ちてまた最初からやり直しになるかもしれません。


SAS言語以外でもコードを書くときは負荷を減らす工夫をしながらコードを書くことは大事だと思うので、今後の業務で意識していきたいと思います。

また発表内容が理解できないものに関しては、事前に調べておいたり、調べる余裕がなければ発表中はせめて発表の目的だけでも頭に入れたり、メモしておいたりして家に帰って調べる方が良いのかなと思いました。

新卒の場合だと、顧客との会議に参加して議事録作成しておいてほしいと頼まれることがあると思いますが、その場合は事前に目を通すと理解しやすくなり、議事録も作成しやすくなります。

自分は少し余裕があったので、もう少しアダプティブデザインや統計用語を調べておけばよかったなと思います。

※今までの案件も簡単に目は通したものの、ちゃんと調べる癖を身に着けていなかったため、今後は事前に目を通すことを心掛けていきたいと思います。。。

余談

SASユーザー総会の会場が東京大学だったので、お昼は学食で食べてきました。
お昼ご飯は滅多に食べないケバブがメニューにあったので、ケバブライスにしました。このケバブライスなのですが、イスラム教信者の方でも食べられるように扱う食品に工夫がされています。
辛いのが好きな方であれば、チリソースたくさんでも良いかもしれません。


ここまでお読みいただき、ありがとうございました!
この記事が少しでも参考になりましたら「スキ」を押していただけると幸いです!

これまでの記事はこちら!

株式会社分析屋について

弊社が作成を行いました分析レポートを、鎌倉市観光協会様HPに掲載いただきました。

ホームページはこちら。

noteでの会社紹介記事はこちら。

【データ分析で日本を豊かに】
分析屋はシステム分野・ライフサイエンス分野・マーケティング分野の知見を生かし、多種多様な分野の企業様のデータ分析のご支援をさせていただいております。 「あなたの問題解決をする」をモットーに、お客様の抱える課題にあわせた解析・分析手法を用いて、問題解決へのお手伝いをいたします!
【マーケティング】
マーケティング戦略上の目的に向けて、各種のデータ統合及び加工ならびにPDCAサイクル運用全般を支援や高度なデータ分析技術により複雑な課題解決に向けての分析サービスを提供いたします。
【システム】
アプリケーション開発やデータベース構築、WEBサイト構築、運用保守業務などお客様の問題やご要望に沿ってご支援いたします。
【ライフサイエンス】
機械学習や各種アルゴリズムなどの解析アルゴリズム開発サービスを提供いたします。過去には医療系のバイタルデータを扱った解析が主でしたが、今後はそれらで培った経験・技術を工業など他の分野の企業様の問題解決にも役立てていく方針です。
【SES】
SESサービスも行っております。

この記事が参加している募集

やってみた