Joy RL：强化学习实践教程最新章节全文无弹窗在线阅读-QQ阅读历史男生网

QQ阅读男生中文玄幻网

男生中文玄幻网

达人推广书架浏览历史

登录 | 注册

书籍简介

本书是继《EasyRL：强化学习教程》（俗称“蘑菇书”）之后，为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验，涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容，旨在帮助读者快速入门强化学习的代码实践，并辅以一套开源代码框架“JoyRL”，便于读者适应业界应用研究风格的代码。与“蘑菇书”不同，本书对强化学习核心理论进行提炼，并串联知识点，重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。

品牌：人邮图书

上架时间：2025-04-01 00:00:00

出版社：人民邮电出版社

本书数字版权由人邮图书提供，并由其授权上海阅文信息技术有限公司制作发行

最新章节

江季王琦杨毅远

同类热门书

最新上架

会员
DeepSeek快速上手
DeepSeek是一种生成式人工智能（AI）大模型，擅长处理复杂任务，具有训练效率高、成本低、性能强、开源等优势，吸引了全世界的关注。本书是写给DeepSeek初学者的快速上手实践指南。本书通过项目实例进行讲解，手把手地教读者如何使用DeepSeek。本书共6章，首先对DeepSeek进行概述，包括其成长路线、优势、技术原理、应用场景、应用方式等；其次讲解如何为DeepSeek写提示词，包括结构化
李强编著计算机3.6万字
会员
智能体设计指南：成为提示词高手和AI Agent设计师
对于我们每个普通人而言，核心的AI能力不是写作不是绘画，也不是编码，而是AIAgent设计！这是一本能帮助每个人轻松构建从提示词编写到AIAgent设计完整知识体系的实战指南，由LangGPT社区的的创始人等几位国内提示词编写和AIAgent设计领域的领军人物撰写，得到了硅基流动创始人袁进辉、润米咨询创始人刘润、通往AGI之路创始人AJ等众多行业专家的高度评价。设计AIAgent，提示词是
云中江树王照华伊丽琦李继刚计算机21.3万字
会员
AI新个体：用DeepSeek重塑一人公司
这是一本写给普通人的个人成长和财富增长指南。两位作者从自身经验出发，讲述如何在AI工具的帮助下，实现“一个人活成一家公司”的梦想。从用AI语音写作完成日更文章，到用AI设计海报、制作课程，再到将AI融入营销和推广，作者以DeepSeek等AI工具为例，总结了如何在各类工作和学习场景中，借助AI来完成认知升级和个人能力的提升。本书适合职场人、学生、自由职业者等各类读者阅读，致力于帮助读者借助AI的力
鱼堂主阿猫计算机6.4万字
心与芯：我们与机器人的无限未来
我们当下正在经历一场AI革命。现在有创纪录的310万个机器人在工厂工作，从事从组装电脑到包装货物以及监测空气质量等各种工作。数量庞大的智能机器以各种各样的方式影响着我们的生活，如提高外科医生的手术精确度，清洁我们的家等等，我们正处于机器智能带来的令人兴奋的可能性当中。下一个万亿规模的企业，也许正在AI机器人领域诞生。当下的机器人产业，远远超出常人的想象。你会看到全世界最先锋的机器人研究团队如何开发
(美)丹妮拉·鲁斯 (美)格雷戈里·莫内计算机13.5万字
为机器立心（通用人工智能的中国蓝图系列）
《为机器立心》的主题是迈向通用人工智能的中国路线，让AI不再缺“心”，点亮人工智能的“中国时刻”。在书中，朱松纯教授解答了什么是通用人工智能、如何认清智能的本质、如何为人工智能找到统一理论与认知架构，进而为机器立“心”等重要问题。全书共分为两大部分。第一部分“厘清通用人工智能的3大关键迷思”：ChatGPT等大模型无异于缸中之脑；要寻找“乌鸦智能”而不是“鹦鹉智能”；理（U体系）与心（V体系）并非
朱松纯计算机11.7万字
会员
DeepSeek操作应用大全：从入门到精通
本书是全面介绍DeepSeek人工智能平台及其应用的实用指南，旨在帮助读者从零基础开始，逐步掌握DeepSeek的各项功能，并最终达到精通水平，能够在各种实际场景中灵活运用DeepSeek解决复杂问题。无论你是人工智能的初学者，还是希望进一步提升技能的专业人士，本书都将为你提供详尽的操作指导和丰富的实战案例。本书共三篇25章，涵盖了DeepSeek的各个方面，从基础入门到高级应用，再到私有化部署，
乔剑苏小文计算机15.6万字
会员
秒懂AI设计：人人都能成为设计高手
随着技术的发展，AI与人们的生活、工作结合得越来越紧密。在设计领域，AI已成为设计师的好帮手。借助AI，设计师可以更好、更快地创作出令人惊艳的作品。本书共9章。第1章系统地介绍了什么是AI设计、有哪些AI设计工具，以及如何撰写提示词让AI生成符合需求的设计作品；第2～9章通过8个实用模块、40多个常见的设计场景，详细介绍了AI在头像和表情包设计、图片处理、社交媒体配图、视频制作、插画绘制、电商设计
秋叶定秋枫赵倚南吴玉佳计算机3万字
会员
大模型工程化：AI驱动下的数据体系
大模型在众多领域得到了广泛应用，促进了AI技术的整合和创新。然而，在实际应用过程中，直接将大模型应用于特定行业常常难以达到预期效果。本书详细阐述如何在游戏经营分析场景中利用大模型实现数据体系的建设。本书分为6个部分，共16章。第1部分主要介绍大模型技术的发展与应用，从大模型的发展现状展开，重点介绍大模型与数据体系的相关知识。第2部分主要介绍大模型下的关键基础设施，涵盖湖仓一体引擎、湖仓的关键技术、
腾讯游戏数据团队编著计算机15.6万字
会员
法律人AI指南：大模型10倍提升工作效率的方法与技巧
本书系统地探讨了人工智能对法律行业的深远影响、法律人应该掌握的AI知识以及相关的法律AI工具。本书共14章，分为五部分。第一部分（第1章）介绍了大模型的基础知识以及AI在法律领域的应用趋势和场景，并深入探讨了AI对法律行业带来的影响等。第二部分（第2~6章）针对法律人的主要工作任务，包括类案检索、案情分析、法律咨询、法律文书写作、合同审查等，详细讲解了应该如何使用AI来提升工作效率。第三部分（第7
张萌李小武兰洋陈中泽等计算机23.8万字

关于腾讯About Tencent服务协议开放平台广告服务腾讯招聘腾讯公益客服中心违规举报

达人推广合作：https://kol.yuewen.com

网站合作：傅女士 fuli.a@yuewen.com

双新用户（设备和账号都新为双新用户）下载并登录后1-20天最多可免费领取20本会员/单订书且可免费读10天

Copyright (C) 2025 bookac.qq.com All Rights Reserved 上海阅文信息技术有限公司版权所有
粤公网安备 44030002000001号增值电信业务经营许可证：粤B2-20090059 互联网ICP备案号：粤B2-20090059-5 沪ICP备14016804号-3 举报电话：010-59357051 营业执照
网络文化经营许可证：沪网文 (2023) 3296-228号网络出版服务许可证：（署）网出证（沪）字第055号互联网宗教信息服务许可证：沪（2023）0000015