策略前展、策略迭代与分布式强化学习 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
策略前展、策略迭代与分布式强化学习电子书下载地址
寄语:
本书目的是从作者近出版的《强化学习与控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题(例
内容简介:
本书目的是从作者近出版的《强化学习预控制》教科书中更深入地发展一些方法。特别是,提出了有关涉及多个代理,分区架构和分布式异步计算的系统的新研究。本书还将详细讨论该方法在挑战离散/组合优化问题(例如路由,调度,分配和混合整数编程)中的应用,包括在这些情况下使用神经网络近似。
本书可作为计算机科学与技术、控制科学与技术、电子科学与技术等相关领域研究生和高年级本科生的教学参考书,也可供信息、通信、控制、优化等领域的科研人员参考。
书籍目录:
暂无相关目录,正在全力查找中!
作者介绍:
Dimitri P. Bertsekas,德梅萃 P.博塞克斯(Dimitri P. Bertseka),美国MIT终身教授,美国国家工程院院士,清华大学复杂与网络化系统研究中心客座教授。电气工程与计算机科学领域国际知名作者,著有《非线性规划》《网络优化》《动态规划》《凸优化》《强化学习与控制》等十几本畅销教材和专著。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
原文赏析:
暂无原文赏析,正在全力查找中!
其它内容:
编辑推荐
读者通过本书可以了解强化学习中策略迭代,特别是Rollout方法在分布式和多智能体框架下的进展和应用。本书可用作人工智能或系统与控制科学等相关专业的高年级本科生或研究生作为一个学期的课程教材。也适用于开展相关研究工作的专业技术人员作为参考书阅读。
前言
本书作者德梅萃·P.博赛卡斯(Dimitri P.Bertsekas)是美国麻省理工学院教授和亚利桑那州立大学教授,也是美国工程院院士。本书是作者近年来相关研究成果的总结。
强化学习,也称为近似动态规划、神经元动态规划。本书的内容围绕强化学习中的策略迭代这一核心概念展开。策略迭代指从某个策略出发,不断产生改进策略的过程。如果仅仅生成一步改进策略,就称为策略前展(Rollout)。大量经验表明,策略前展是当前用得广、为可靠的强化学习方法之一。主要内容: 第1章为动态规划原理; 第2章为策略前展与策略改进; 第3章为专用策略前展算法; 第4章为值和策略的学习; 第5章为无限时间分布式和多智能体算法。
横空出世的围棋软件AlphaZero算法对本书有很大影响。本书内容同样基于策略迭代、值网络和策略网络的神经网络近似表示、并行与分布式计算和前瞻小化约简技术的核心框架构建,并对算法的适用范围做了拓展。本书的特色在于给出了分布式计算和多智能体系统框架下的强化学习策略改进计算的效率提升技术,建立了一步策略改进策略前展方法同控制系统中广泛使用的模型预测控制(MPC)设计方法之间的联系,并描述了策略前展方法在复杂离散和组合优化问题方面的应用。
通过阅读本书,读者可以了解强化学习中的策略迭代,特别是策略前展方法在分布式和多智能体框架下的进展和应用。本书可用作人工智能或系统与控制科学等相关专业的高年级本科生或研究生的教材,也适合开展相关研究工作的专业技术人员作为参考书。
赵千川
清华大学自动化系教授
清华大学智能与网络化系统研究中心主任
2021年10月
网站评分
书籍多样性:4分
书籍信息完全性:5分
网站更新速度:6分
使用便利性:9分
书籍清晰度:7分
书籍格式兼容性:8分
是否包含广告:9分
加载速度:3分
安全性:8分
稳定性:9分
搜索功能:4分
下载便捷性:8分
下载点评
- 值得购买(672+)
- 目录完整(266+)
- 强烈推荐(346+)
- azw3(61+)
- 书籍完整(488+)
- 体验还行(211+)
- 盗版少(650+)
- 赚了(547+)
- 引人入胜(289+)
- 速度快(285+)
- 内涵好书(393+)
- 体验满分(320+)
下载评价
- 网友 扈***洁: ( 2025-01-03 14:09:58 )
还不错啊,挺好
- 网友 宫***玉: ( 2025-01-16 14:31:54 )
我说完了。
- 网友 索***宸: ( 2025-01-16 22:04:22 )
书的质量很好。资源多
- 网友 薛***玉: ( 2025-01-06 21:29:53 )
就是我想要的!!!
- 网友 隗***杉: ( 2025-01-03 05:03:22 )
挺好的,还好看!支持!快下载吧!
- 网友 屠***好: ( 2025-01-08 10:49:51 )
还行吧。
- 网友 冯***丽: ( 2025-01-11 15:07:48 )
卡的不行啊
- 网友 家***丝: ( 2024-12-25 01:32:59 )
好6666666
- 网友 郗***兰: ( 2024-12-21 00:22:10 )
网站体验不错
- 网友 訾***雰: ( 2025-01-16 00:19:13 )
下载速度很快,我选择的是epub格式
- 网友 康***溪: ( 2024-12-27 04:15:03 )
强烈推荐!!!
- 网友 后***之: ( 2025-01-10 16:12:07 )
强烈推荐!无论下载速度还是书籍内容都没话说 真的很良心!
喜欢"策略前展、策略迭代与分布式强化学习"的人也看了
- 管理大略 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 乔布斯传 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 黑白之间 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 2024春小学教材全解三年级下册数学北师大版BS小学课本教材同步学习工具书小学3年级数学下册金星教育系列丛书薛金星 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 营养密码:身体缺什么,你就补什么 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 美丽新疆 9787509412817 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 成功金版-经营一家赚钱的服装店大全集 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 2012证券市场基础知识 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 最经典的365夜睡前故事(夏之卷) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
- 北斗地图 增效学习工具:错题本-(2018全新修订) 下载 pdf 百度网盘 epub 免费 2025 电子书 mobi 在线
书籍真实打分
故事情节:8分
人物塑造:3分
主题深度:8分
文字风格:8分
语言运用:4分
文笔流畅:9分
思想传递:7分
知识深度:5分
知识广度:7分
实用性:3分
章节划分:5分
结构布局:3分
新颖与独特:7分
情感共鸣:6分
引人入胜:4分
现实相关:5分
沉浸感:9分
事实准确性:5分
文化贡献:6分