続・初級統計学【多変量解析入門】
2022年度後期(10月ー2月)のご受講、および、録画販売についてお申し込み受付中です。録画視聴による参加、途中参加も可能。こちらからお申込みいただけます。
講座の概要
この講座は、初級統計学のステップアップ講座です。多変量解析を中心として統計学への理解をさらに深めつつ、実践において統計学の知識を活用できるように、コンピューターを活用した様々な演習についても積極的に行っていきます。
初級統計学を受講された後に本講座を受講することで、初学者の方であっても統計学の全体像を把握し、基本を網羅することができます。
多変量解析とは
多変量解析は、変数間の相互関係を分析する統計的な解析手法であり、様々な分野で応用されています。統計学の様々な手法のなかでも、現時点で最も広く使われているものであるといえるでしょう。統計の実践において避けては通れないといわれる多変量解析ですが、この分野は、初学者にとって最も習得のハードルが高い分野のひとつです。本講座では、独学では学びづらい多変量解析について集中的に学び、手を動かしてトレーニングを重ねていくことで、理解・習得を図っています。
受講にあたって
受講にあたって役に立つ知識
・統計検定2級程度の統計学の知識(初級統計学)
・高校数学の知識(大人のための高校数学IIB)
目標
多変量解析の各手法について、理論的背景を踏まえてRによる分析ができるようになる。
カリキュラム
1. 重回帰分析
線型重回帰分析をRで実行し,出力される数値の意味やモデルの検討方法について解説します.
また,非線型回帰分析(累乗モデル,指数モデル)についても触れます.
2. ロジスティック回帰
具体的な2クラス分類の問題を通してロジスティック回帰の解説を行います.
ロジスティック回帰の推定では最尤法という考え方が用いられています.
最尤法は統計学を学んでいると何度も登場する重要な概念であるにも拘らず,理解するのが難しく躓きやすいところです.
ここでは,シンプルな例題を解きながら,最尤法という考え方についても丁寧に説明します.
一般化線形モデルと呼ばれるより広い手法の特殊な場合と考えることができます.
この分野についてさらに学びたい方は弊社講座「データ解析のための統計モデリング入門」の受講をおすすめします.
3. 主成分分析
複雑なデータを少ない変数で要約し解釈をする,主成分分析という手法について解説します.
主成分分析の計算は相関行列(または共分散行列)の固有ベクトルの計算に他なりません.
そこで,主成分分析そのものの説明の前に,行列の基本的な扱い方を必要なものに絞って解説します.
4. 因子分析
因子分析は,複雑なデータを少ない変数で要約するという意味で,前章で学んだ主成分分析に似た手法です.
ここでは主成分分析との違いを押さえながら因子分析について解説します.
因子分析では回転と呼ばれる重要概念が登場します.これは因子を線形変換する操作で,ここでも行列の理論が活躍します.
5. 判別分析
古典的な分類の手法である判別分析について解説します.
判別分析は,線形判別分析と非線形判別分析に分けられます.
線形判別分析は群間変動,群内変動という2つの散らばりかたに着目して判別を行う手法です.
また,非線型判別分析の手法として,マハラノビスの距離を用いた判別分析を紹介します.
6. クラスター分析
似たデータをまとめ上げる,クラスター分析の手法を扱います.
クラスター分析には大きく分けて,階層的クラスタリングと非階層的クラスタリングの2つがあります.
階層的クラスタリングについてはウォード法,非階層的クラスタリングについてはk-means法を紹介します.
7. 決定木とアンサンブル学習
決定木は分類の手法の一つです.どのような規則で分類が行われているかがわかりやすく,結果の解釈がしやすいことが特徴です.
一方で過学習を起こしやすく,精度の高い分析をすることが難しいという側面もあります.
後半では,アンサンブル学習という工夫によってより精度の高い分析が行えることを解説します.
8. 数量化類と同値な手法
数量化類とは本来は量的な変数で行う多変量解析の手法を質的な変数に対しても行えるように拡張した手法群です.
この章では数量化類と同じ(あるいはほぼ同じ)でより扱いやすい手法について解説します.
9. サポートベクターマシン
サポートベクターマシンとはマージン最大化を基本的なアルゴリズムとする2クラス分類の手法です.
まずは基本となる線形分類の数理について解説をし,カーネル法と呼ばれるテクニックによって非線形の分類問題に拡張していきます.
10. ニューラルネットワーク
この章ではニューラルネットワークやディープラーニングと呼ばれる手法について解説します.
これらの手法の最小単位であるパーセプトロン学習器の説明から始め,どのように拡張されていくかを見ていきます.
また,計算の鍵となる誤差逆伝播と最急降下法についても説明します.
この分野に関する講義で扱う以上の発展や工夫,Pythonによる実行についてさらに学びたい方はDeepLearning入門の受講をお勧め致します.
11. 構造方程式モデリング
これまでに学んできた重回帰分析や主成分分析,因子分析といった手法たちをパス図という方法で俯瞰し,
構造方程式モデリングというより自由度の高い分析手法について解説します.
12. データを用いた演習
総復習としてデータを配布し自由に分析の演習を行います.
問題設定に応じた手法の選択や結果の解釈,実際にRで実行するにはどうしたら良いかなど,改めて自ら実践してみることで知識が定着します.
最初は「やってみると教科書の真似をしながらでも意外と難しい…」となるかもしれませんが講師がサポートをしながら進めていきますのでご安心ください.
受講詳細
受講のお申し込みは、お申込フォームからお願いします。
名称 | 続・初級統計学 |
---|---|
講師 | 中村伸一郎 |
日程 | ・土曜クラス : 10:00-12:00, 10/8-2/25, (12/24, 12/31は休講) * 詳細は下記の開講スケジュールをご参照ください。 |
場所 | Zoomによるオンライン講座 ※会場が変更となる場合があります。その際には、事前にご連絡をさしあげます。 |
教科書 | すうがくぶんかのオリジナルテキスト ※ テキスト代は受講料に含まれています。 |
受講料 | 24,500円/月 クレジットカード支払いはこちらのページから。 |
持ち物 | ノートパソコン(統計ソフトRを予めインストールしておいてください。) Rは世界中の統計実務家や統計学者が採用している無料の統計ソフトです。こちらのWebサイトからRをインストールできます。 |
その他 | ・授業は毎回録画されます。受講月の録画は授業終了から2年間オンラインにて見放題となります(ダウンロード不可)。 ・動画視聴のみの受講も可能です。お急ぎの方は、過去講座の録画にてご受講いただけます。 |
お申込
※ご希望の曜日を選択のうえ、送信をお願いします。
3日以上経っても返信がない場合は、お手数ですが、suugakubunnka@gmail.comまでご連絡ください。
講師からの一言
この講座では、様々な多変量解析の手法を紹介していきますが、データを分析する際にそれらをどのように利用していくか、できるだけ現実のデータを用いて解説していきます。また分析結果をどのように評価、解釈していくかについてしっかりと解説します。それらを通して、様々な数学が多変量解析にどのように応用されているかを実感していただきたいと思っています。
開講スケジュール
土曜日クラス:12月24日、12月31日土曜日は休講です。
土曜日クラス 10:00〜12:00 | |
---|---|
第1講 | 10月8日 |
第2講 | 10月15日 |
第3講 | 10月22日 |
第4講 | 10月29日 |
第5講 | 11月5日 |
第6講 | 11月12日 |
第7講 | 11月19日 |
第8講 | 11月26日 |
第9講 | 12月3日 |
第10講 | 12月10日 |
第11講 | 12月17日 |
第12講 | 1月7日 |
第13講 | 1月14日 |
第14講 | 1月21日 |
第15講 | 1月28日 |
第16講 | 2月4日 |
第17講 | 2月11日 |
第18講 | 2月18日 |
第19講 | 2月25日 |