強化学習入門(シリーズ機械学習の数理:9月)
2020年度9月開講分、お申込受付中です。こちらからお申込みいただけます。
講座の概要
この講座はシリーズ機械学習の数理の9月分です。
強化学習は機械学習のフレームワークの一つで、プラントの最適化など実社会への応用が期待されている分野の一つです。この講座では、強化学習の基礎について、Pythonと数学を通して学んでいきましょう。特に、
- 価値反復法
- 方策勾配法
の具体的なアルゴリズムを数式を読みながら勉強し、numpyパッケージを用いて実装します。また深層強化学習の話題から、最も基本的なDeep Q-Networkの仕組みに触れ、kerasパッケージを用いた実装を通して親しむことを目指します。
受講にあたって
受講する上で必要な知識
- Python言語(特にnumpy, matplotlib)の基本的な使い方に親しみがある。
- 高校数学IIICまでの微分の計算に親しみがある。
カリキュラム
- 強化学習の概要
1. どのような問題を対象にしているか?
2. 何を目標にしているか?
3. 強化学習を数学的に表現すると? - 価値反復法
1. 状態行動価値を導入しよう
2. 状態行動価値から何がわかるの?
3. 状態行動価値を推定するアイディアはあるの?
4. Sarsaアルゴリズムを実装してみよう
5. Q-学習アルゴリズムを実装してみよう
6. 学習時に工夫をしてみよう
7. SarsaとQ-学習の違いはなに? - 方策勾配法
1. 方策勾配を導入しよう
2. 方策勾配はどうやって推定するの?
3. REINFORCEアルゴリズムを実装してみよう
4. 方策勾配の推定をもっと精度良くできないの?
5. baselineを実装しよう - Deep Q-Network
1. 状態行動価値をニューラルネットワークで表現してみよう
2. ニューラルネットワークのアーキテクチャをコーディングしてみよう
3. 強化学習のデータの時系列性を考慮しよう
4. Experience Decayを実装してみよう
5. 学習を安定させるアイディアはないの?
6. Target Networkを実装してみよう
お申込み
お申し込みは、お申込フォームからお願いします。
※お手数ですが、件名について『強化学習入門(シリーズ機械学習の数理:9月)』を選択のうえ送信をお願いします。
名称 | 強化学習入門(シリーズ機械学習の数理:9月) |
---|---|
講師 | 内場崇之 |
日程 | 計2回の集中講義になります。 第1回 9月6日(日) 10:00-15:00 第2回 9月13日(日) 10:00-15:00 |
場所 | Zoomによるオンライン講座となります。 |
教科書 | 講師オリジナルテキスト ※ テキスト代は受講料に含まれています。 |
受講料 | 全2回34,500円 クレジットカード支払いはこちらのページから。 |
持ち物 | ・筆記用具 ・Pythonをインストールしたパソコン |