6/2 時点_ポイント最大15倍

強化学習/森村哲郎

販売店：bookfan

販売価格

3,630

円（税込）

送料無料

出荷目安：: 1～3日で発送予定

たまるdポイント（通常） 33

+キャンペーンポイント（期間・用途限定）最大14倍

各キャンペーン詳細およびエントリーはこちら

※たまるdポイントはポイント支払を除く商品代金(税抜)の1％です。

※表示倍率は各キャンペーンの適用条件を全て満たした場合の最大倍率です。
各キャンペーンの適用状況によっては、ポイントの進呈数・付与倍率が最大倍率より少なくなる場合がございます。

dカードでお支払ならポイント3倍

6/2時点

■通常ポイント	1倍
dカードでお支払いの場合	＋2倍

＜内訳＞
■キャンペーンポイント（期間・用途限定）	＋14倍
2店舗以上買い回りでポイント2～10倍！（要エントリー/購入条件あり/付与上限あり）	＋9倍（6/10迄）詳細はこちら
dカード支払いでポイント＋3倍（要エントリー/購入条件あり/付与上限あり）	＋3倍（6/10迄）詳細はこちら
アプリなら＋2倍（要エントリー/購入条件あり/付与上限あり）	＋2倍（6/10迄）詳細はこちら

※ポイント表記に関するご留意事項

5000円 OFFクーポン

※ご好評につき終了いたしました(上限枚数到達)

3000円 OFFクーポン

※先着利用枚数 500枚

1500円 OFFクーポン

※先着利用枚数 1000枚

※クーポン適用後の費用は決済画面で確認できます

bookfan トップに戻る

電気工学の一覧を見る

商品レビューを投稿するには

商品情報
レビュー

森村哲郎
講談社
機械学習プロフェッショナルシリーズ
ISBN：4065155916/9784065155912
発売日:2019年05月

※商品画像はイメージや仮デザインが含まれている場合があります。帯の有無など実際と異なる場合があります。

【内容紹介】
理論は裏切らない
・強化学習で必要になる数理を広くカバーした。
・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実!
・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く!

【おもな内容】
第1章準備
1.1 強化学習とは
1.2 マルコフ決定過程と逐次的意思決定問題
1.3 方策
1.4 逐次的意思決定問題の定式化

第2章プランニング
2.1 準備
2.2 動的計画法
2.3 動的計画法による解法
2.4 線形計画法による解法

第3章探索と活用のトレードオフ
3.1 概要
3.2 探索と活用のトレードオフ
3.3 方策モデル

第4章モデルフリー型の強化学習
4.1 データにもとづく意思決定
4.2 価値関数の推定
4.3 方策と行動価値関数の学習
4.4 収束性
4.5 アクター・クリティック法

第5章モデルベース型の強化学習
5.1 問題設定の整理
5.2 環境推定
5.3 ブラックボックス生成モデルに対するプランニング
5.4 オンラインのモデルベース型強化学習

第6章関数近似を用いた強化学習
6.1 概要
6.2 価値関数の関数近似
6.3 方策の関数近似

第7章部分観測マルコフ決定過程
7.1 部分観測マルコフ決定過程(POMDP)の基礎
7.2 POMDP のプランニング
7.3 POMDP の学習

第8章最近の話題
8.1 分布強化学習
8.2 深層強化学習

付録A 補足
A.1 証明
A.2 ノルム
A.3 線形計画法
A.4 自然勾配法の補足

強化学習/森村哲郎

強化学習/森村哲郎のレビュー

この商品のカテゴリ

同カテゴリのおすすめ商品

別カテゴリのおすすめ商品

ふるさと納税百選のおすすめ返礼品

商品を探す

ジャンルから探す

お店から探す

ランキングから探す