11/26
時点_ポイント最大11倍
最適化のための強化学習 /小林和博 久保幹雄
販売価格
3,520
円 (税込)
送料無料
- 出荷目安:
- 1~2営業日で出荷
たまるdポイント(通常) 32
+キャンペーンポイント(期間・用途限定) 最大10倍
※たまるdポイントはポイント支払を除く商品代金(税抜)の1%です。
※表示倍率は各キャンペーンの適用条件を全て満たした場合の最大倍率です。
各キャンペーンの適用状況によっては、ポイントの進呈数・付与倍率が最大倍率より少なくなる場合がございます。
dカードでお支払ならポイント3倍
各キャンペーンの適用状況によっては、ポイントの進呈数・付与倍率が最大倍率より少なくなる場合がございます。
- 商品情報
- レビュー
≪商品情報≫
著者名:小林和博、久保幹雄
出版社名:近代科学社
発行年月:2024年09月
判型:B5
ISBN:9784764907102
≪内容情報≫
本書では、強化学習における基本的な考え方や計算手法を紹介し、実際にPython を用いて実現する方法をまとめている。具体的にはマルコフ決定過程、価値関数、方策評価、方策反復、価値反復、モンテカルロ評価、SARSA、Q学習を扱う。ほとんどの内容は簡単な数学の知識があれば問題なく理解できるよう記述し、読者の学びやすさを優先して繰り返しの説明や既出の数式を再掲するなど工夫している。Pythonの基礎から強化学習の利用までを詳細に解説した充実の一冊。
著者名:小林和博、久保幹雄
出版社名:近代科学社
発行年月:2024年09月
判型:B5
ISBN:9784764907102
≪内容情報≫
本書では、強化学習における基本的な考え方や計算手法を紹介し、実際にPython を用いて実現する方法をまとめている。具体的にはマルコフ決定過程、価値関数、方策評価、方策反復、価値反復、モンテカルロ評価、SARSA、Q学習を扱う。ほとんどの内容は簡単な数学の知識があれば問題なく理解できるよう記述し、読者の学びやすさを優先して繰り返しの説明や既出の数式を再掲するなど工夫している。Pythonの基礎から強化学習の利用までを詳細に解説した充実の一冊。