【無料公開講座_2019】強化学習入門講座
2019年度、お申込受付中です。こちらからお申込みいただけます。
講座の概要
強化学習の実社会への応用は、囲碁におけるAlphaGoの活躍が印象強いかもしれませんが、
・信号機の制御
・web広告のreal time bidding
・プラントの自動最適化
など、実社会の様々な領域で応用研究が進められている興味深い機械学習のフレームワークです。この講座では、強化学習の考え方やいくつかの手法例を数学とPythonによるデモを通して解説します。
受講にあたって
受講にあたって役に立つ知識
・条件つき確率と期待値
・高校数学に現れる微分
・Python言語(特にnumpy, matplotlib)の簡単なコーディングスキル
目標
・強化学習のフレームワークを理解する。
・強化学習の方策勾配法と価値反復法のアイディアを理解する。
カリキュラム
- 強化学習のフレームワーク
a. 概要の説明
b. 強化学習の数学的な定式化
c. 探索と利用のジレンマ - 価値反復法
a. Markov決定過程
b. 状態価値・行動価値とBellman方程式
c. Q-learningとPythonを用いたデモ - 方策勾配法
a. 方策勾配法の一例とPythonを用いたデモ
b. REINFORCEと方策勾配定理(やや難) - いくつかのremark
a. 深層強化学習
b. 環境の設計
講座詳細
名称 | 【無料公開講座_2019】強化学習入門 |
---|---|
講師 | 内場崇之 |
日程 | 12月28日(土) 10:00-17:00 |
場所 | 会場再度変更になりました。ご注意ください。 汐留ビジネスフォーラム 130名会議室 東京都港区東新橋1-1-21 今朝ビル 5F(新橋・汐留駅徒歩2分) |
教科書 | 講師オリジナルテキスト |
受講料 | 無料 |
持ち物 | 筆記用具 anaconda環境をインストールしたPC(必須ではない) |
お申込み
※お手数ですが、件名に『強化学習入門』を選択のうえ送信をお願いします。
講師からの一言
6時間という短時間の講座ですが、数学とプログラミングによるデモを交えて、なるべく概要を抑えるような講座にしようと思っております。奮ってご参加ください。
すうがくぶんかについて
社会人のための数学教室すうがくぶんかでは、「もっと社会に数学を」を理念に学校を卒業した後も本格的な数学や統計学を学ぶ様々な機会を提供しています。本講座以外の講座につきましては開講講座一覧をぜひごらんください。