中图网

>

研究生/本科/专科教材

>

工学

随机动态决策理论与应用

作者：胡奇英

出版社：西安电子科技大学出版社出版时间：2023-07-01

开本：其他页数： 280

本类榜单：教材销量榜

中图价:¥35.3(7.5折) 定价 ~~¥47.0~~ 登录后可看到会员价

加入购物车收藏

运费6元，满69元免运费

?快递不能达地区使用邮政小包，运费14元起

云南、广西、海南、新疆、青海、西藏六省，部分地区快递不可达

本类五星书更多>

>
中医基础理论

中医基础理论

¥54.9¥59
>
高校军事课教程

高校军事课教程

¥12.2¥38
>
毛泽东思想和中国特色社会主义理论体系概论(2021年版)

毛泽东思想和中国特色社会主义理论体系概论(2021年版)

¥17.5¥25
>
中医内科学·全国中医药行业高等教育“十四五”规划教材

中医内科学·全国中医药行业高等教育“十四五”规划教材

¥69.3¥99
>
中医诊断学--新世纪第五版

中医诊断学--新世纪第五版

¥53.9¥58
>
中药学·全国中医药行业高等教育“十四五”规划教材

中药学·全国中医药行业高等教育“十四五”规划教材

¥85.1¥99
>
中医外科学——全国中医药行业高等教育“十四五”规划教材

中医外科学——全国中医药行业高等教育“十四五”规划教材

¥89.3¥96

商品详情
商品评论(0条)

中图价:¥35.3 加入购物车

版权信息
内容简介
目录

微信公众号

随机动态决策理论与应用版权信息

ISBN：9787560667492
条形码：9787560667492 ; 978-7-5606-6749-2
装帧：平装-胶订
册数：暂无
重量：暂无
所属分类：
教材
>
研究生/本科/专科教材
>
工学

随机动态决策理论与应用内容简介

本书介绍随机动态决策的理论与应用。全书共14章，分为理论篇和应用篇。第1章~第6章为理论篇，内容包括离散时间马尔可夫决策过程(有限阶段、无限阶段折扣准则、无限阶段平均准则），半马尔可夫决策过程，连续时间马尔可夫决策过程，强化学习与近似算法；第7章~第14章为应用篇，内容包括库存管理，收益管理，网上拍卖，网上拍卖下的收益管理、库存管理，技术的采用与选择，排队（服务）系统的*优控制，组合证券选择与风险管理，供应链动态管理。
本书适合作为高等院校管理科学、运筹学、自动控制、计算机科学等专业的研究生教材，也可供对动态决策理论、人工智能诸方面感兴趣的研究人员阅读。

随机动态决策理论与应用目录

第1章有限阶段 2 1.1 单阶段决策 2 1.2 多阶段动态决策：确定性 3 1.3 多阶段马尔可夫决策过程 8 1.3.1 模型 9 1.3.2 *优方程与*优策略 11 1.4 若干随机动态决策问题 13 1.4.1 期权的购买与执行问题 13 1.4.2 *优选择问题 15 1.4.3 产品定价问题 17 1.5 模函数与单调策略 18 1.5.1 *优策略的单调性 18 1.5.2 受罚款限制的*优分配问题 20 习题 22 参考文献 23 第2章离散时间马尔可夫决策过程：折扣准则 24 2.1 模型与折扣*优方程 24 2.1.1 模型 24 2.1.2 *优方程 25 2.2 算法 29 2.2.1 逐次逼近法(值迭代法) 29 2.2.2 策略迭代法 32 2.2.3 线性规划法 34 2.3 应用 36 2.3.1 *优停止问题 36 2.3.2 项目管理：Bandit问题 40 2.4 MDP模型的推广 43 2.4.1 一种无界报酬条件 43 2.4.2 非可数决策集 48 2.4.3 一般策略集 50 2.5 期望总报酬准则 51 2.5.1 模型缩减 52 2.5.2 报酬函数的有限性 53 2.5.3 *优值函数的有限性及*优方程 53 习题 55 参考文献 56 第3章离散时间马尔可夫决策过程：平均准则 57 3.1 平均准则的*优方程 57 3.1.1 平均准则的*优方程与*优策略 57 3.1.2 常返性条件 63 3.1.3 有限MDP 65 3.2 算法 66 3.2.1 逐次逼近法 66 3.2.2 策略迭代法 70 3.2.3 线性规划法 72 3.3 *优不等式 75 本章附录：若干引理 79 习题 81 参考文献 82 第4章半马尔可夫决策过程 83 4.1 半马尔可夫决策过程模型 83 4.1.1 SMDP模型 83 4.1.2 正则性条件 84 4.1.3 准则函数 86 4.2 转换为离散时间马尔可夫决策过程 86 4.2.1 期望折扣总报酬准则 86 4.2.2 平均准则 88 4.3 马尔可夫型SMDP 92 4.4 模型推广：报酬函数的一般形式 93 习题 95 参考文献 95 第5章连续时间马尔可夫决策过程 96 5.1 时齐模型 96 5.2 期望折扣总报酬准则 98 5.2.1 折扣准则 98 5.2.2 期望折扣总报酬准则 102 5.3 平均准则 104 5.4 非时齐模型 106 习题 113 参考文献 113 第6章强化学习与近似算法 114 6.1 强化学习：折扣准则 114 6.1.1 折扣目标函数值的估计 114 6.1.2 强化学习算法 115 6.1.3 TD(λ) 118 6.2 强化学习：平均准则 119 6.2.1 平均准则函数值的估计 119 6.2.2 平均准则的强化学习算法 120 6.3 近似算法 122 6.3.1 近似逐次逼近法 123 6.3.2 近似策略迭代法 124 习题 126 参考文献 126 应用篇第7章库存管理 128 7.1 多周期随机库存管理问题 128 7.1.1 多周期库存管理问题 128 7.1.2 有限阶段期望折扣总费用 130 7.1.3 短视策略 131 7.2 无限阶段随机存贮问题 132 7.2.1 无限阶段折扣准则 132 7.2.2 无限阶段平均准则 135 7.2.3 损失制 135 7.3 存贮与定价的联合动态决策 137 7.3.1 有限阶段 138 7.3.2 无限阶段 140 习题 141 参考文献 141 第8章收益管理 142 8.1 价格固定时的容量分配 142 8.1.1 静态模型 142 8.1.2 动态模型 145 8.1.3 预订和超订 146 8.2 价格动态变化时的多阶段容量分配 147 8.3 连续时间动态定价 151 8.4 基于Priceline的买方/卖方定价收益管理问题 156 8.4.1 买方定价 156 8.4.2 卖方定价 159 8.5 房地产市场的政府调控策略：基于收益管理 160 8.6 收益管理的进一步讨论 163 习题 164 参考文献 165 第9章网上拍卖 166 9.1 拍卖简介 166 9.2 单物品网上拍卖中的顾客投标策略 167 9.2.1 问题与模型 168 9.2.2 IPV下硬性结束规则的一级价格网上拍卖 169 9.2.3 IPV下软性结束规则的一级价格网上拍卖 174 9.2.4 其他类型的网上拍卖 175 9.3 单阶段多物品网上拍卖的收益 177 习题 181 参考文献 182 第10章网上拍卖下的收益管理、库存管理 183 10.1 网上分批拍卖下的收益管理 183 10.1.1 问题与模型 183 10.1.2 *优分配策略的单调性 184 10.1.3 数值分析 189 10.2 网上拍卖下的库存管理 191 10.2.1 有限阶段 191 10.2.2 折扣准则 194 10.2.3 平均准则 197 10.2.4 *优保留价 198 10.2.5 数值分析 199 习题 202 参考文献 203 第11章技术的采用与选择 204 11.1 *优更换 204 11.1.1 有限阶段 204 11.1.2 无限阶段折扣准则 206 11.1.3 平均准则 208 11.2 技术采用 209 11.3 基于购买的技术更新问题 212 11.4 基于自行研发的技术更新问题 215 11.5 新产品策略与库存管理 219 习题 221 参考文献 221 第12章排队(服务)系统的*优控制 222 12.1 排队系统的到达控制 222 12.1.1 M/G/1排队系统的静态到达率控制 222 12.1.2 M/M/K排队系统的动态到达率控制 224 12.1.3 一般动态到达控制 226 12.2 排队系统服务控制 228 12.2.1 M/M/1: 队长模型 229 12.2.2 M/PH/1: 队长与工作量混合模型 233 12.3 排队网络控制 234 12.3.1 到达控制 234 12.3.2 服务控制 235 12.3.3 路径控制 236 习题 237 参考文献 237 第13章组合证券选择与风险管理 239 13.1 动态资产定价 239 13.2 多阶段组合证券的期望-方差分析 241 13.3 多阶段风险管理：条件风险值CVaR 248 13.3.1 问题与模型 248 13.3.2 *小CVaR和*优策略 249 13.3.3 应用：组合证券优化 251 习题 255 参考文献 255 第14章供应链动态管理 256 14.1 易腐产品的供应链多周期管理 256 14.2 连续时间收益供应链管理 259 14.2.1 集中决策 260 14.2.2 分散决策 267 习题 270 参考文献 271 后记272

展开全部

商品评论(0条)

写书评赚书币

暂无评论……

书友推荐

>
山海经
山海经
林非
¥19.2~~¥68.0~~
>
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)
易竹贤
¥9.9~~¥23.0~~
>
二体千字文
二体千字文
本书编委会
¥16.0~~¥40.0~~
>
罗曼·罗兰读书随笔-精装
罗曼·罗兰读书随笔-精装
[法]罗曼·罗兰著,郑克鲁译
¥40.6~~¥58.0~~
>
经典常谈
经典常谈
朱自清
¥22.7~~¥39.8~~
>
有舍有得是人生
有舍有得是人生
梁实秋
¥19.4~~¥45.0~~
>
大红狗在马戏团-大红狗克里弗-助人
大红狗在马戏团-大红狗克里弗-助人
[美] 诺尔曼·伯德韦尔著，杜可名译
¥3.9~~¥10.0~~
>
巴金－再思录
巴金－再思录
巴金
¥33.1~~¥46.0~~

本类畅销

家居设计解剖书

(日)家居协会编著

¥27.3~~¥39~~
网络安全基础

徐国天

¥27.7~~¥39.5~~
家具造型设计

黄嘉琳编著

¥34.3~~¥49~~
工程硕士研究生英语基础教程学生用书

罗立胜

¥45.6~~¥68~~
国外电子与通信教材系列信号与系统(第二版)

[美]AlanV.Oppenheim（艾

¥69.3~~¥99~~
工程机械维修

刘朝红

¥30.8~~¥40~~

随机动态决策理论与应用

随机动态决策理论与应用版权信息

随机动态决策理论与应用内容简介

随机动态决策理论与应用目录

山海经

新文学天穹两巨星--鲁迅与胡适/红烛学术丛书(红烛学术丛书)

二体千字文

罗曼·罗兰读书随笔-精装

经典常谈

有舍有得是人生

大红狗在马戏团-大红狗克里弗-助人

巴金－再思录

家居设计解剖书

网络安全基础

家具造型设计

工程硕士研究生英语基础教程学生用书

国外电子与通信教材系列信号与系统(第二版)

工程机械维修

朱仙镇年画:七日谈

时间停止的那一天

人间草木

房思琪的初恋乐园

陶潜和樱子

上海滩的贾斯汀·比伯

随机动态决策理论与应用

随机动态决策理论与应用 版权信息

随机动态决策理论与应用 内容简介

随机动态决策理论与应用 目录

随机动态决策理论与应用版权信息

随机动态决策理论与应用内容简介

随机动态决策理论与应用目录