
強化学習の基礎についてPythonを通して学ぶ
強化学習は機械学習のフレームワークの一つで、囲碁や将棋等のゲーム、プラントの最適化など実社会への応用や最近の大規模言語モデルのReasoningにも活用される等幅広く使われている分野の一つです。この講座では、強化学習の基礎について、Pythonと数学を通して学んでいきましょう。特に、
- 価値反復法
- 方策勾配法
の具体的なアルゴリズムを数式を読みながら勉強し、numpyパッケージを用いて実装します。
また深層強化学習の話題から、最も基本的なDeep Q-Networkの仕組みに触れ、実装を通して親しむことを目指します。