中图网检索: (美)安德里亚·隆萨

欢迎光临中图网请 | 注册

购物车
我的订单
我的账户

我的收藏夹账户余额我的优惠券我的书币收货地址我的书评我的消息书币换券
帮助中心
手机中图网

扫一扫 关注中图网
官方微博

扫一扫 关注中图网
微信公众号

手机中图网 进入中图网
手机触屏版

搜索

搜索全部

搜索全部
书名
作者
出版社
ISBN

阅读是一座随身携带的避难所人间草木生活如此多娇假装得很辛苦茶经

图书分类

全部商品分类>>

新上架特价书

今日值得买：新品折上折 > 新到特价书精选 > 最近10日上架 > 新到1000本特价书 >

上新2万种！每满100减50

中图网

>

关于“(美)安德里亚·隆萨”检索到共1种现货商品

分类：

计算机/网络(1)

展开

出版社：

中国电力出版社(1)

所有出版社 Z

确定取消

中国电力出版社(1)
中国电力出版社(1)

中国电力出版社(1)
中国电力出版社(1)

更多

展开

售价：

50-100元(1)

￥

---

￥

确定

折扣：

5-7折(1)

---

确定

搜索

搜索全部

搜索全部
书名
作者
出版社
ISBN

基于Python的强化学习

(美)安德里亚·隆萨 / 2023-01-01 / 中国电力出版社

¥50.2(5.7折)定价:~~¥88.0~~

本书首先介绍在强化学习环境中工作所需的工具、库和设置，涵盖了强化学习的构成模块，深入探讨基于值的方法，如Q-learning和SARSA算法的应用。读者将学习如何结合使用Q-learning和神经网络来解决复杂问题。此外，在学习DDPG和TD3确定性算法之前，读者将学习策略梯度方法，如TRPO和PPO，以提高性能和稳定性。本书还介绍模仿学习的原理，以及Dagger如何教智能体飞行。读者将探索进化策略和黑盒优化技术。最后，读者将掌握探索

加入购物车收藏

五星书

中国古典诗词名篇文化鉴赏

张长青

¥27.9~~¥68.0~~
《鲁迅日历》

贝为任

¥24.4~~¥66.0~~
蛤蟆先生去看心理医生

[英] 罗伯特·戴博德著，陈赢译

¥34.2~~¥38.0~~
边走边画——皖南文化考察与写生教学

郭磊等著

¥21.5~~¥55.0~~
(精)范仲淹全集 (全二册)

范仲淹

¥153.8~~¥248.0~~

编辑推荐

时间停止的那一天

[英]蕾秋·乔伊斯著,焦晓菊译

￥10.7~~￥42.8~~

加入购物车
陶潜和樱子

刘争争

￥14.4~~￥38~~

加入购物车
百年梦忆－梁实秋人生自述

梁实秋

￥9.0~~￥28~~

加入购物车
人间草木

汪曾祺

￥18.5~~￥34.8~~

加入购物车
上海滩的贾斯汀·比伯

老王子

￥14.8~~￥39~~

加入购物车
房思琪的初恋乐园

林奕含

￥31.5~~￥45~~

加入购物车

新手上路: 新用户指引; 注册用户更改注册信息; 购物常见问题; 关于特价书的常见问题

购买问题: 订单跟踪; 付款方式; 账户余额申请提现; 配送方式及费用、范围; 集团购买

售后服务: 退换货流程; 投诉与建议

特色服务: 会员等级与书币; 中图网书馨卡; 邀请好友购买返10元礼包

其他信息: 本站简介; 联系我们; 招聘英才; 网站联盟; 友情链接

微信公众号

中图网微博

手机中图网

中图网

诚信认证

电子商务诚信单位认证

京ICP备09013606号-3 京信市监发[2002]122号海淀公安分局备案编号：1101083394

营业执照出版物经营许可证京出发京批字第直110071