機械学習プロフェッショナル、統計学OnePoint 解説講座シリーズ

受講・録画視聴のお申し込みは各講座詳細ページにて受付中です。

シリーズ第一弾の紹介動画公開中!

シリーズの概要

本講座シリーズでは、著名な機械学習・統計学の教科書シリーズである、機械学習プロフェッショナル(講談社サイエンティフィク)および統計学OnePoint(共立出版)の解説講座を順次開講していきます。

第一弾(2022年1月~3月、3月~5月開講)統計的因果探索、テキストアナリティクス

シリーズ第一弾では機械学習プロフェッショナルより統計的因果探索(清水昌平著)を、統計学OnePointよりテキストアナリティクス(金明哲著)を解説します。

統計的因果探索(2022年1月~3月)

統計的因果探索とは、各変数間の因果関係を表す「因果グラフ」をデータから推定するタスクのことです。

例えば統計的因果探索を用いることで、ある商品を製造するにあたって「さまざまな製造条件が中間特性を経て、どのようにして不良率に影響与えるのか?」という問いにアプローチすることができます。

この講座では、主に

  • 統計的因果探索とはなにか?
  • 統計的因果探索の代表的な手法:LiNGAM

の基本的な部分について、講談社サイエンティフィクの機械学習プロフェッショナルシリーズより、清水先生の著書『統計的因果探索』を用いて解説を行います。

詳細はこちらから:『統計的因果探索』解説講座 詳細・申し込みページ

テキストアナリティクス(2022年3月~5月)

テキストアナリティクスとはテキストデータを統計や機械学習の手法で分析し、例えばトピックに沿った文章の自動分類や、スパムメールの判定モデルの構成を目指すデータ分析分野の一つです。

この講座ではkmeans法などの一般的な統計的手法の復習をしながら、テキストアナリティクス特有の手法やデータの前処理を順を追って解説していきます。

共立出版統計学OnePointシリーズより、金明哲先生の著書『テキストアナリティクス』を参考に、Rによるデモンストレーションを交えながら具体的なテキストアナリティクスの過程を理解しましょう。

詳細はこちらから:『テキストアナリティクス』解説講座 詳細・申し込みページ

 

第二弾(2022年5月~6月、7月~8月開講)異常検知と変化検知、欠測データ処理

シリーズ第二弾では機械学習プロフェッショナルより異常検知と変化検知(井手剛・杉山将著)を、統計学OnePointより欠測データ処理―Rによる単一代入法と多重代入法― (高橋 将宜・渡辺 美智子著)を解説します。

異常検知と変化検知(2022年5月~6月)

クレジットカードの不正利用や機器の故障を検知する異常検知は、その重要性とは裏腹に機械学習のタスクとしては簡単ではありません。例えば、異常イベントの少なさによる正常イベントと異常イベントの不均衡さといった問題があります。

このような困難を克服するアイデアとして、一旦正常データの傾向のみを掴み、新しいデータがその傾向からどれだけ外れているかを異常度とする「教師なしアプローチ」があります。

この講座では、井出先生・杉山先生の『異常検知と変化検知』(講談社サイエンティフィク)を教科書に、異常検知への「教師なしアプローチ」を学んでいきます。

詳細はこちらから:『異常検知と変化検知』解説講座 詳細・申し込みページ

欠測データ処理(2022年7月~8月)

アンケート調査では回答者が全ての質問に回答するとは限りません。ある質問については回答していても、別の質問については無回答といったことが往々にして起こります。このような無回答が含まれている欠測データでは標本平均も相関係数も計算できません。

そのような状況に対応するシンプルなアイデアとして、無回答がある回答者のデータを削除してしまう「リストワイズ除去」が挙げられますが、値の偏りや小標本による問題が発生することがあります。

そこで、この講座では高橋先生・渡辺先生の『欠測データ処理―Rによる単一代入法と多重代入法―』(共立出版)を教科書に、何かしらの値を無回答欄に代入することでデータを擬似的に完全にする「代入法」とよばれる欠測データ処理の手法を紹介していきます。

※詳細・申し込みページは近日公開予定です。