強化学習の基礎についてPythonを通して学ぶ
強化学習は機械学習のフレームワークの一つで、プラントの最適化など実社会への応用が期待されている分野の一つです。この講座では、強化学習の基礎について、Pythonと数学を通して学んでいきましょう。
また深層強化学習の話題から、最も基本的なDeep Q-Networkの仕組みに触れ、kerasパッケージを用いた実装についても学習します。
※アーカイブ講座の動画販売についてお申し込み受付中です。
統計・機械学習講座
スポット講座
Sスタンダード
アーカイブ講座(録画販売中)
強化学習は機械学習のフレームワークの一つで、プラントの最適化など実社会への応用が期待されている分野の一つです。この講座では、強化学習の基礎について、Pythonと数学を通して学んでいきましょう。
また深層強化学習の話題から、最も基本的なDeep Q-Networkの仕組みに触れ、kerasパッケージを用いた実装についても学習します。
※アーカイブ講座の動画販売についてお申し込み受付中です。
強化学習は機械学習のフレームワークの一つで、プラントの最適化など実社会への応用が期待されている分野の一つです。この講座では、強化学習の基礎について、Pythonと数学を通して学んでいきましょう。特に、
の具体的なアルゴリズムを数式を読みながら勉強し、numpyパッケージを用いて実装します。また深層強化学習の話題から、最も基本的なDeep Q-Networkの仕組みに触れ、kerasパッケージを用いた実装を通して親しむことを目指します。
すうがくぶんかのオリジナルテキスト
デジタルデータ(jupyter)をメール添付にてお送りいたします
1. どのような問題を対象にしているか?
2. 何を目標にしているか?
3. 強化学習を数学的に表現すると?
1. 状態行動価値を導入しよう
2. 状態行動価値から何がわかるの?
3. 状態行動価値を推定するアイディアはあるの?
4. Sarsaアルゴリズムを実装してみよう
5. Q-学習アルゴリズムを実装してみよう
6. 学習時に工夫をしてみよう
7. SarsaとQ-学習の違いはなに?
1. 方策勾配を導入しよう
2. 方策勾配はどうやって推定するの?
3. REINFORCEアルゴリズムを実装してみよう
4. 方策勾配の推定をもっと精度良くできないの?
5. baselineを実装しよう
1. 状態行動価値をニューラルネットワークで表現してみよう
2. ニューラルネットワークのアーキテクチャをコーディングしてみよう
3. 強化学習のデータの時系列性を考慮しよう
4. Experience Decayを実装してみよう
5. 学習を安定させるアイディアはないの?
6. Target Networkを実装してみよう
講座名 | 強化学習入門:機械学習の数理シリーズ |
---|---|
担当講師 | |
開講スケジュール |
計2回の集中講義になります。 |
受講方法 |
Zoomによるオンライン講座 |
教科書 | すうがくぶんかのオリジナルテキスト |
受講料 | 全2回 税込34,500円 |
お支払い方法 |
クレジットカード支払いは本ページ下部「受講料のお支払いについて」よりお願いいたします。 |
準備物 | ・筆記用具 |
下記のボタンを押すと該当する集団講座のチケットをご購入いただけます。
※ボタンを押すと、stripeの決済ページへ遷移します。
全2回 |
---|
2020年前期分よりオンライン授業を録画し、授業の録画販売(アーカイブ販売)を行っております。
アーカイブ講座の動画購入をご検討いただく場合は、下記についてご確認をお願いいたします。
本講座は開講中の講座はございません。
アーカイブ講座(録画購入)にてご受講いただけます。
アーカイブ講座(録画購入)のお申し込みはこちら
講座名 | 動画内容 | 講師名 | 受講料 |
---|---|---|---|
強化学習入門:機械学習の数理シリーズ 2020年後期 |
全2回 | 内場 崇之 | 34,500円 |
年度別 講座情報
年度 | 講座情報 |
---|---|
ー | 本講座は2020年後期のみの開講です。 |
講座のお申し込み・ご相談は
気軽にお問い合わせください。