続・初級統計学【多変量解析入門】

2020年度後期(10月-2月)開講分、お申込受付中です。こちらからお申込みいただけます。

講座の概要

この講座は、初級統計学のステップアップ講座です。多変量解析を中心として統計学への理解をさらに深めつつ、実践において統計学の知識を活用できるように、コンピューターを活用した様々な演習についても積極的に行っていきます。(こちらの講座は大阪でも開講しております。詳しくはこちらをご覧ください。)

初級統計学を受講された後に本講座を受講することで、初学者の方であっても統計学の全体像を把握し、基本を網羅することができます。

多変量解析とは

多変量解析は、変数間の相互関係を分析する統計的な解析手法であり、様々な分野で応用されています。統計学の様々な手法のなかでも、現時点で最も広く使われているものであるといえるでしょう。統計の実践において避けては通れないといわれる多変量解析ですが、この分野は、初学者にとって最も習得のハードルが高い分野のひとつです。本講座では、独学では学びづらい多変量解析について集中的に学び、手を動かしてトレーニングを重ねていくことで、理解・習得を図っています。

受講にあたって

受講にあたって役に立つ知識
・統計検定2級程度の統計学の知識(初級統計学
・高校数学の知識(大人のための高校数学IIB
目標
多変量解析の各手法について、理論的背景を踏まえてRによる分析ができるようになる。

カリキュラム

1. 重回帰分析

線型重回帰分析をRで実行し,出力される数値の意味やモデルの検討方法について解説します.
また,非線型回帰分析(累乗モデル,指数モデル)についても触れます.

2. ロジスティック回帰

具体的な2クラス分類の問題を通してロジスティック回帰の解説を行います.
ロジスティック回帰の推定では最尤法という考え方が用いられています.
最尤法は統計学を学んでいると何度も登場する重要な概念であるにも拘らず,理解するのが難しく躓きやすいところです.
ここでは,シンプルな例題を解きながら,最尤法という考え方についても丁寧に説明します.
一般化線形モデルと呼ばれるより広い手法の特殊な場合と考えることができます.
この分野についてさらに学びたい方は線形モデル入門の受講をおすすめします.

3. 主成分分析

複雑なデータを少ない変数で要約し解釈をする,主成分分析という手法について解説します.
主成分分析の計算は相関行列(または共分散行列)の固有ベクトルの計算に他なりません.
そこで,主成分分析そのものの説明の前に,行列の基本的な扱い方を必要なものに絞って解説します.

4. 因子分析

因子分析は,複雑なデータを少ない変数で要約するという意味で,前章で学んだ主成分分析に似た手法です.
ここでは主成分分析との違いを押さえながら因子分析について解説します.
因子分析では回転と呼ばれる重要概念が登場します.これは因子を線形変換する操作で,ここでも行列の理論が活躍します.

5. 判別分析

古典的な分類の手法である判別分析について解説します.
判別分析は,線形判別分析と非線形判別分析に分けられます.
線形判別分析は群間変動,群内変動という2つの散らばりかたに着目して判別を行う手法です.
また,非線型判別分析の手法として,マハラノビスの距離を用いた判別分析を紹介します.

6. クラスター分析

似たデータをまとめ上げる,クラスター分析の手法を扱います.
クラスター分析には大きく分けて,階層的クラスタリングと非階層的クラスタリングの2つがあります.
階層的クラスタリングについてはウォード法,非階層的クラスタリングについてはk-means法を紹介します.

7. 決定木とアンサンブル学習

決定木は分類の手法の一つです.どのような規則で分類が行われているかがわかりやすく,結果の解釈がしやすいことが特徴です.
一方で過学習を起こしやすく,精度の高い分析をすることが難しいという側面もあります.
後半では,アンサンブル学習という工夫によってより精度の高い分析が行えることを解説します.

8. アソシエーション分析

アソシエーション分析は「オムツを買った人はビールも買いがち」のような購買のパターンを発見するための手法です.
いくつかの確率(や条件付き確率)の値を組み合わせて

10. 数量化類と同値な手法

数量化類とは本来は量的な変数で行う多変量解析の手法を質的な変数に対しても行えるように拡張した手法群です.
この章では数量化類と同じ(あるいはほぼ同じ)でより扱いやすい手法について解説します.

11. サポートベクターマシン

サポートベクターマシンとはマージン最大化を基本的なアルゴリズムとする2クラス分類の手法です.
まずは基本となる線形分類の数理について解説をし,カーネル法と呼ばれるテクニックによって非線形の分類問題に拡張していきます.

12. ニューラルネットワーク

この章ではニューラルネットワークやディープラーニングと呼ばれる手法について解説します.
これらの手法の最小単位であるパーセプトロン学習器の説明から始め,どのように拡張されていくかを見ていきます.
また,計算の鍵となる誤差逆伝播と最急降下法についても説明します.
この分野に関する講義で扱う以上の発展や工夫,Pythonによる実行についてさらに学びたい方はDeepLearning入門の受講をお勧め致します.

13. 構造方程式モデリング

これまでに学んできた重回帰分析や主成分分析,因子分析といった手法たちをパス図という方法で俯瞰し,
構造方程式モデリングというより自由度の高い分析手法について解説します.

14. データを用いた演習

総復習としてデータを配布し自由に分析の演習を行います.
問題設定に応じた手法の選択や結果の解釈,実際にRで実行するにはどうしたら良いかなど,改めて自ら実践してみることで知識が定着します.
最初は「やってみると教科書の真似をしながらでも意外と難しい…」となるかもしれませんが講師がサポートをしながら進めていきますのでご安心ください.

受講詳細

お申し込みは、お申込フォームからお願いします。
※お手数ですが、件名に『続・初級統計学』を選択のうえ送信をお願いします。

名称 続・初級統計学
講師 内場崇之
日程 ・土曜クラス : 10:00-12:00, 10/10-2/27, (12/26, 1/2は休講)

* 詳細は下記の開講スケジュールをご参照ください。

場所 Zoomによるオンライン講座
※会場が変更となる場合があります。その際には、事前にご連絡をさしあげます。
教科書 すうがくぶんかのオリジナルテキスト
※ テキスト代は受講料に含まれています。
受講料 24,500円/月
クレジットカード支払いはこちらのページから。
持ち物 ノートパソコン(統計ソフトRを予めインストールしておいてください。)
Rは世界中の統計実務家や統計学者が採用している無料の統計ソフトです。こちらのWebサイトからRをインストールできます。
振替受講について
自分の登録しているクラス(曜日・時間帯)で受講できない日がある場合、振替受講として、他の曜日に開講しているクラスで受講していただくことができます。ご希望の方は、スケジュール表をご確認のうえ、受講を希望するクラス(振替先のクラス)の実施日より前に講師にお知らせください。

お申込

※ご希望の曜日を選択のうえ、送信をお願いします。

お名前 (必須)


件名(必須)

お問合せ内容 詳細


講師からの一言

この講座では、様々な多変量解析の手法を紹介していきますが、データを分析する際にそれらをどのように利用していくか、できるだけ現実のデータを用いて解説していきます。また分析結果をどのように評価、解釈していくかについてしっかりと解説します。それらを通して、様々な数学が多変量解析にどのように応用されているかを実感していただきたいと思っています。

開講スケジュール

12月26日土曜日、1月2日土曜日は休講です。

土曜日クラス
10:00〜12:00
第1講 10月10日
第2講 10月17日
第3講 10月24日
第4講 10月31日
第5講 11月7日
第6講 11月14日
第7講 11月21日
第8講 11月28日
第9講 12月5日
第10講 12月12日
第11講 12月19日
第12講 1月9日
第13講 1月16日
第14講 1月23日
第15講 1月30日
第16講 2月6日
第17講 2月13日
第18講 2月20日
第19講 2月27日