スモールデータ解析の方法と実問題解決への応用
オンラインセミナー
スモールデータ解析の方法と実問題解決への応用
~スモールデータの解析の実態とその方法論、データ収集の考え方~
不特定多数の多量のデータでではなく、特定の専門データである「スモールデータ」の活用で生産現場などの実務・現実問題の解決を
少量のデータから統計モデルを構築したい方、現場でのデータ解析、データ収集についてお困りの方は是非
開催日
2025年11月18日(火)10:30~16:30
2025年11月18日(火)10:30~16:30
このセミナーで学べること
スモールデータの収集方法
必要となるデータの質、データ収集の留意点を実例を通じて習得
解析手法の選択
スモールデータ解析の手法選択と実態を理解
機械学習の基礎
入力変数選択・異常検知手法などスモールデータに適したデータ解析手法
セミナー詳細
開催形式・日時
【ライブ配信】 2025年11月18日(火)10:30~16:30
【アーカイブ配信】 2025年12月5日(金)まで受付(視聴期間:12/5~12/18)
オンライン配信:ライブ配信(Zoom)/ アーカイブ配信
配布資料
PDFデータ(印刷可・編集不可)
※ライブ配信受講は開催2日前を目安にS&T会員のマイページよりダウンロード可となります。
※アーカイブ配信受講は配信開始日からダウンロード可となります。
セミナーの目的
本セミナーでは、実例を通じ、スモールデータの解析の実態と、その方法論、データ収集の考え方を講義します。
- 入力変数選択・異常検知手法などスモールデータに適したデータ解析手法の習得
- スモールデータにおけるデータ収集の心構えの習得
対象者
- 少量のデータから統計モデルを構築したいと考えられている方
- 現場でのデータ解析に従事されている方
- 現場におけるデータ収集についてお困りの方
プログラム
1. スモールデータとは
- 1.1 スモールデータの特徴
- 1.2 スモールデータ解析の現状
2. スモールデータ解析の方法論:次元削減と回帰分析
- 2.1 主成分分析(PCA)
- PCAとは
- 直交展開
- PCAの導出
- PCAと特異値分解
- 2.2 最小二乗法
- 回帰分析とは
- 相関係数の意味
- 最小二乗法の導出
- 最小二乗法の幾何学的意味
- 多重共線性の問題
- 2.3 部分的最小二乗法(PLS)
- PLSとは
- 潜在変数モデル
- PLSモデルの導出
- NIPALSアルゴリズム
- PLSから重回帰モデルへの変換
- クロスバリデーションによるパラメータチューニング
3. スモールデータ解析の方法論:入力変数選択
- 3.1 入力変数選択とは
- 3.2 スパースモデリング
- スパースとは
- リッジ回帰
- Lasso回帰
- エラスティックネットモデル
- Group Lasso
- 3.3 変数クラスタリングによる入力変数選択
- スペクトラルクラスタリング
- NC法のコンセプト
- NCSCアルゴリズムの導出
- NCSCを用いた変数クラスタリングと入力変数選択
- 製薬プロセスへの応用例
4. スモールデータ解析の方法論:不均衡データ解析
- 4.1 サンプリング手法
- サンプリング手法とは
- アンダーサンプリングとオーバーサンプリング
- 4.2 ブースティング
- ブースティングとは
- AdaBoost
- RandomForest
- 4.3 ブースティングとサンプリング手法を組み合わせた不均衡データ解析
- 何故、ブースティングとサンプリング手法を組み合わせるか
- RUSBoost
- HUSDOS-Boost
- 4.4 不均衡データ解析の大規模検診データへの適用例
5. スモールデータ解析の方法論:異常検出
- 5.1 異常検出とは
- 5.2 多変量統計的プロセス管理(MSPC)
- MPSCとは
- T2統計量とQ統計量の幾何学的意味
- 5.3 自己符号化器(オートエンコーダー)
- 5.4 異常検出問題の医療データ解析への応用例
6. スモールデータの収集・解析の考え方
- 6.1 必要となるデータの質の問題
- 6.2 データ収集の際の留意点
- 6.3 スモールデータ解析の手法選択
質疑応答