强化学习:原理与Python实战在线阅读
会员

强化学习:原理与Python实战

肖智清
开会员,本书免费读 >

计算机网络人工智能17.2万字

更新时间:2023-10-19 17:44:38 最新章节:封底

立即阅读
加书架
下载
听书

书籍简介

本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

肖智清
主页

最新上架

  • 会员
    在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次
    王鼎 赵明明 哈明鸣 任进计算机8.7万字
  • 会员
    大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建
    王晓华计算机12.8万字
  • 会员
    本书是一部系统介绍AI数字人技术的专业著作,涵盖了数字人的定义、发展历程、关键技术及应用实践等内容,全书共分3部分。在技术基础部分,首先介绍了数字人的定义、发展历程、分类和应用场景,接着详细解析了数字人系统的架构设计、视觉算法和语音合成技术的原理,以及语义理解和知识表示技术如何提升数字人的智能和表现力。在应用实践部分,带领读者深入探索数字人的创作流程,从内容策划、角色建模到交互设计,每一步都进行了
    方进计算机26.2万字
  • 会员
    ChatGPT作为人工智能领域的一大进步,引起了热议,其强大功能的背后离不开大模型的支持。大模型指的是参数规模超过千万的机器学习模型,主要应用于语音识别、计算机视觉等领域。本书聚焦大模型,对大模型的技术场景和商业应用展开详细叙述。本书主要从典型应用ChatGPT入手,探寻其背后支撑大模型的魅力。首先,本书对大模型的基础概念、产业格局、带来的新型商业模式进行讲解,展现了大模型的发展现状和商业化潜力。
    梅磊 施海平 陈靖计算机13.2万字
  • 会员
    《机器学习实战:视频教学版》基于Python语言详细讲解机器学习算法及其应用,用于读者快速入门机器学习。《机器学习实战:视频教学版》共分12章,内容包括机器学习概述、Python数据处理基础、Python常用机器学习库、线性回归及应用、分类算法及应用、数据降维及应用、聚类算法及应用、关联规则挖掘算法及应用、协同过滤算法及应用,最后通过3个综合实战项目(包括新闻内容分类实战、泰坦尼克号获救预测实战、
    迟殿委 王培进 王兴平计算机10.1万字
  • 本书分两篇,为读者提供基于制造业视角的大模型理论与应用指南。基础篇深入大模型理论层面,主要介绍大模型的基础知识、构建路径、价值对齐策略,同时涉及多模态与AIGC技术、提示词工程的相关知识。应用篇则聚焦于大模型的实践应用层面,主要讲解垂直制造领域微调、RAG等构建技术,AIAgent的原理与应用,以及大模型压缩与部署策略,并且通过具体案例来展示大模型在工业制造及设备运维等方面的应用,最后对大模型进行
    郭秉义计算机18.3万字
  • 会员
    本书旨在帮助读者全面理解知识图谱的基本原理和概念。通过清晰的解释和实例,读者将深入了解知识图谱的构建、表示、推理等关键知识点。此外,本书通过提供代码实战,引导读者亲自动手构建知识图谱,并应用各种技术和工具进行实践。这种实践性的讲解方法可帮助读者更深入地理解知识图谱的实际应用。本书的目标是帮助读者全面理解知识图谱的基本原理和概念,并通过代码实战构建知识图谱。同时,本书也提供了关于大语言模型与知识图谱
    刘威编著计算机9.6万字
  • 会员
    《洞察AIGC:智能创作的应用、机遇与挑战》内容分为3篇:第1篇AIGC的蜕变讲述AIGC的发展历史及其背后的智能;第2篇AIGC的应用讲述AIGC在文学创作、日常办公、知识管理、科研出版、工业制造、健康医疗、金融服务、品牌营销领域的应用现状及常用工具;第3篇AIGC的机遇与挑战讲述AIGC的资本与技术前景,同时提出需要注意的风险。
    李海俊计算机13.9万字
  • 会员
    本书由科大讯飞与中国科大的大模型的资深专家联合撰写,一本书打通大模型的技术原理与应用实践壁垒,深入大模型3步工作流程,详解模型微调、对齐优化、提示工程等核心技术及不同场景的微调方案,全流程讲解6个典型场景的应用开发实践。本书共10章,从逻辑上分为“基础知识”“原理与技术”“应用开发实践”三部分。基础知识(第1章)介绍大模型定义、应用现状、存在的问题,以及发展趋势。原理与技术(第2和3章)详细讲解大
    于俊 刘淇 程礼磊 程明月计算机12.3万字