- 本セクションで使用するファイルについて
- 強化学習の中心概念、「状態、行動、報酬、方策」について
- バンディットクラスの作成
- エージェントはどのように学習を行うのか
- 行動をランダムに選ぶエージェントの作成
- 記録を更新するメソッドを作成
- 勝率を確認する
- 経験知を活かすエージェントの作成
- イプシロングリーディ法を実装する
- イプシロングリーディ法の結果をプロットする
- 状態(レート)の変動する非定常問題を考える
- 非定常問題へのエージェントの対応結果
What you'll learn
- 強化学習の基礎
- 状態価値、行動価値などの意味
- バンディット問題の理解
- pythonのプログラミング
Description
価値関数やQ学習、モンテカルロ法、SARSA、
Temporal Difference法などを含めた
強化学習の基礎を学ぶコースを計画しておりました。
ですが、高等な数式を分かりやすく説明するのが難しく、
長期間寝かせてしまい、結局、途中で断念しました。。。
このままではもったいないと思い、
無料講座としてご提供することにしました。
このコースでは強化学習の最初の導入例としてよく用いられるバンディット問題を検討していきます。
本コースが深層強化学習へとつながっていく皆さんの学習の一助となることを願っております。
ぜひお役立てください。
Other Courses
Power BI for Kids
Learn the fundamentals of Microsoft Power BI as a business Intelligence tool
HTML and CSS Basics: Begin to Develop and Design Websites
Start mastering the essentials of HTML and CSS.
Microsoft Excel - Journey from Beginner to Advanced in Excel
Master Microsoft Excel. Learn Data Analysis and Business Data Analysis With Excel.
Healing Binge Eating Through Intuitive Eating
Ending the Diet Binge Cycle with Intuitive Eating
How To Start Dropshipping On Etsy In 2024
From Beginner to Pro: Navigating Etsy's Marketplace
About the instructors
- 4.41 Calificación
- 3653 Estudiantes
- 7 Cursos
Kaiki Fukunaga
ウェブアプリ制作(Python, JavaScript)、業務効率化アプリ制作
はじめまして。
Fukunagaと申します。
私はウェブアプリ制作を中心に活動しています。バックエンドにはpythonを用いることが多く、データベースとの連携、豊富なライブラリをの導入など、小規模ながらウェブサイトや業務効率化などのアプリを作っています。
React、Vueなどのライブラリ、フレームワークを用いることでウェブアプリ制作の作業を効率よく進めることができます。しかし、vanilla JavaScriptでわざわざではありますが、コツコツと基礎的な事を確認しながらコードを組み上げていくことに楽しさを感じています。前進するたび感じる小さな喜びがプログラミングを続けているモチベーションのひとつとなっています。
また、データサイエンスの分野にも関わることがあり、自分の性格に合っているのか、どんどんと深みにはまっています。こちらの分野でも知見を集積し、いずれはコースを作りたいと考えています。
どうぞよろしくお願いします。
Student feedback
Course Rating
Reviews
非常に丁寧に、説明されています。強化学習を学ぶ、良い講座です。
コードの書き方を含めて非常に丁寧に説明されています。最後まで完成させておられないのが残念です。