
会员
Joy RL:强化学习实践教程
更新时间:2025-05-19 16:15:54 最新章节:第12章
书籍简介
本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
江季 王琦 杨毅远
同类热门书
最新上架
- 会员DeepSeek是一种生成式人工智能(AI)大模型,擅长处理复杂任务,具有训练效率高、成本低、性能强、开源等优势,吸引了全世界的关注。本书是写给DeepSeek初学者的快速上手实践指南。本书通过项目实例进行讲解,手把手地教读者如何使用DeepSeek。本书共6章,首先对DeepSeek进行概述,包括其成长路线、优势、技术原理、应用场景、应用方式等;其次讲解如何为DeepSeek写提示词,包括结构化计算机3.6万字
- 会员对于我们每个普通人而言,核心的AI能力不是写作不是绘画,也不是编码,而是AIAgent设计!这是一本能帮助每个人轻松构建从提示词编写到AIAgent设计完整知识体系的实战指南,由LangGPT社区的的创始人等几位国内提示词编写和AIAgent设计领域的领军人物撰写,得到了硅基流动创始人袁进辉、润米咨询创始人刘润、通往AGI之路创始人AJ等众多行业专家的高度评价。设计AIAgent,提示词是计算机21.3万字
- 会员这是一本写给普通人的个人成长和财富增长指南。两位作者从自身经验出发,讲述如何在AI工具的帮助下,实现“一个人活成一家公司”的梦想。从用AI语音写作完成日更文章,到用AI设计海报、制作课程,再到将AI融入营销和推广,作者以DeepSeek等AI工具为例,总结了如何在各类工作和学习场景中,借助AI来完成认知升级和个人能力的提升。本书适合职场人、学生、自由职业者等各类读者阅读,致力于帮助读者借助AI的力计算机6.4万字
- 会员本书是全面介绍DeepSeek人工智能平台及其应用的实用指南,旨在帮助读者从零基础开始,逐步掌握DeepSeek的各项功能,并最终达到精通水平,能够在各种实际场景中灵活运用DeepSeek解决复杂问题。无论你是人工智能的初学者,还是希望进一步提升技能的专业人士,本书都将为你提供详尽的操作指导和丰富的实战案例。本书共三篇25章,涵盖了DeepSeek的各个方面,从基础入门到高级应用,再到私有化部署,计算机15.6万字
- 会员随着技术的发展,AI与人们的生活、工作结合得越来越紧密。在设计领域,AI已成为设计师的好帮手。借助AI,设计师可以更好、更快地创作出令人惊艳的作品。本书共9章。第1章系统地介绍了什么是AI设计、有哪些AI设计工具,以及如何撰写提示词让AI生成符合需求的设计作品;第2~9章通过8个实用模块、40多个常见的设计场景,详细介绍了AI在头像和表情包设计、图片处理、社交媒体配图、视频制作、插画绘制、电商设计计算机3万字
- 会员大模型在众多领域得到了广泛应用,促进了AI技术的整合和创新。然而,在实际应用过程中,直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分,共16章。第1部分主要介绍大模型技术的发展与应用,从大模型的发展现状展开,重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施,涵盖湖仓一体引擎、湖仓的关键技术、计算机15.6万字
- 会员本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章,分为五部分。第一部分(第1章)介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景,并深入探讨了AI对法律行业带来的影响等。第二部分(第2~6章)针对法律人的主要工作任务,包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等,详细讲解了应该如何使用AI来提升工作效率。第三部分(第7计算机23.8万字