讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

DDPG Project「建议收藏」

爱谁谁

发布时间：2025-07-16 08:28:01

|

658人浏览过

|

来源于php中文网

原创

大家好，我们又见面了，我是你们的老朋友全栈君。

请记住，在Q函数学习中，DQN与DDPG的区别在于，目标的下一个最大Q值是由actor估计的，而不是critic自身。在连续动作空间中，critic无法在没有优化的情况下估计最大Q值。因此，最佳选择是直接使用actor给出最佳动作。

第一张图片中的代码有误：

第71行：critic_target网络基于actor_target网络的估计输出最大Q值，因此不需要再次执行max操作（但在DQN中，我们确实需要那个max操作，因为在DQN中，下一最大Q值是由critic_target本身直接估计的（Q值函数））。

第72行：DDPG中的critic（Q函数）可以直接输出相对输入动作的Q值，因此不需要聚集动作索引相关的Q值。

第74行：因为优化器会累积梯度值，所以使用optimizer.zero_grad()清除它（而不是使用network.zero_grad）。

第75行：优化器应该调用step()函数来反向传播误差。

Mamba个人博客小程序版

Mamba个人博客小程序版

这是一个个人博客小程序版，使用 Mpvue 编写而成，服务端使用的是Bmob后端云，无需开发服务端接口即可使用，快速便捷，适合个人使用，功能包括签到，收藏文章，查看文章，消息通知，评论文章，回复评论等。欢迎提建议和意见。

下载

别忘了添加最终状态的判定：1- dones。

DDPG Project「建议收藏」第79行：在actor学习部分，critic_local的输入动作不是样本动作，而是由actor估计的动作（要注意这一点）。此外，它应该计算其平均值。最后，我们希望最大化性能，但优化器用于最小化目标，因此我们必须设置负号。

DDPG Project「建议收藏」在soft_update中，记得使用数据的属性进行复制。

DDPG Project「建议收藏」发布者：全栈程序员栈长，转载请注明出处：https://www.php.cn/link/8eb7be5a13cc39a3e56b78aba08b2039

相关文章

Linux如何搭建容器镜像仓库_LinuxRegistry仓库部署

Linux如何构建数据加密系统_LinuxAES与RSA开发示例

Linux如何构建HTTPS通信模块_LinuxOpenSSL集成方法

Linux如何构建轻量级文件服务_Linux文件服务开发

Linux如何创建高性能HTTP服务_Linux网络开发案例

相关标签:

区别 html 栈 https

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：玩转mongoDB（五）：mongoDB 3.0+ 查询性能分析下一篇：【Docker】linux 安装docker

作者最新文章

html5怎么加scrollview_HT5用div设overflow:auto或插件实现滚动视图【添加】

2025-12-24 13:50

Depseek怎样生成年终总结大纲_Depseek总结大纲生成与框架定制【教程】

2025-12-24 13:51

研招网成绩查询官网入口研招网2026初试成绩查询地址

2025-12-24 13:54

铁路12306如何改签车次_铁路12306改签车次详细改签步骤

2025-12-24 13:56

洋抖tiktok官网入口洋抖tiktok官方网站在线登录

2025-12-24 13:56

海外抖音tiktok免费网站在线入口抖音外国网站入口tiktok直接打开

2025-12-24 13:59

ACG动漫网直达入口 ACG动漫网站永久在线观看正版首页

2025-12-24 14:00

12306高铁票查询网页登录最新官方入口地址

2025-12-24 14:02

阿里拍卖平台官网如何筛选同城拍品_阿里拍卖平台官网地域筛选与地图查看【指南】

2025-12-24 14:05

vk如何发布投票_vk投票功能使用步骤【教程】

2025-12-24 14:09

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

html版权符号

html版权符号

html版权符号是“©”，可以在html源文件中直接输入或者从word中复制粘贴过来，php中文网还为大家带来html的相关下载资源、相关课程以及相关文章等内容，供大家免费下载使用。

581

2023.06.14

html在线编辑器

html在线编辑器

html在线编辑器是用于在线编辑的工具，编辑的内容是基于HTML的文档。它经常被应用于留言板留言、论坛发贴、Blog编写日志或等需要用户输入普通HTML的地方，是Web应用的常用模块之一。php中文网为大家带来了html在线编辑器的相关教程、以及相关文章等内容，供大家免费下载使用。

635

2023.06.21

html网页制作

html网页制作

html网页制作是指使用超文本标记语言来设计和创建网页的过程，html是一种标记语言，它使用标记来描述文档结构和语义，并定义了网页中的各种元素和内容的呈现方式。本专题为大家提供html网页制作的相关的文章、下载、课程内容，供大家免费下载体验。

455

2023.07.31

html空格

html空格

html空格是一种用于在网页中添加间隔和对齐文本的特殊字符，被用于在网页中插入额外的空间，以改变元素之间的排列和对齐方式。本专题为大家提供html空格的相关的文章、下载、课程内容，供大家免费下载体验。

240

2023.08.01

html是什么

html是什么

HTML是一种标准标记语言，用于创建和呈现网页的结构和内容，是互联网发展的基石，为网页开发提供了丰富的功能和灵活性。本专题为大家提供html相关的各种文章、以及下载和课程。

2843

2023.08.11

html字体大小怎么设置

html字体大小怎么设置

在网页设计中，字体大小的选择是至关重要的。合理的字体大小不仅可以提升网页的可读性，还能够影响用户对网页整体布局的感知。php中文网将介绍一些常用的方法和技巧，帮助您在HTML中设置合适的字体大小。

500

2023.08.11

html转txt

html转txt

html转txt的方法有使用文本编辑器、使用在线转换工具和使用Python编程。本专题为大家提供html转txt相关的文章、下载、课程内容，供大家免费下载体验。

305

2023.08.31

html文本框代码怎么写

html文本框代码怎么写

html文本框代码：1、单行文本框【<input type="text" style="height:..;width:..;" />】；2、多行文本框【textarea style=";height:;"></textare】。

416

2023.09.01

苹果官网入口直接访问

苹果官网入口直接访问

苹果官网直接访问入口是https://www.apple.com/cn/，该页面具备0.8秒首屏渲染、HTTP/3与Brotli加速、WebP+AVIF双格式图片、免登录浏览全参数等特性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

6

2025.12.24

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

Mamba个人博客小程序版

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

CSS3 教程

CSS3 教程

共18课时 | 3.9万人学习

JavaScript ES5基础线上课程教学

JavaScript ES5基础线上课程教学

共6课时 | 6.9万人学习

手把手教你通过宝塔搭建网站服务器

手把手教你通过宝塔搭建网站服务器

共1课时 | 881人学习

最新文章

更多

Linux进程调度策略怎么看_优先级与nice值说明【技巧】

Linux网络状态怎么检测_常见误区解析避免新手踩坑【指导】

Linux日志怎么分析_核心逻辑讲解助你快速掌握【教程】

Linux文件篡改怎么检测_完整性校验方案讲解【教学】

Linux LAMP环境部署教学_Linux ApacheMySQLPHP搭建方法

LinuxSSH安全怎么提升_关键技巧整理帮助提高效率【教学】

Linux用户权限如何最小化_安全运维最佳实践【教程】

Linux脚本如何自动化_核心逻辑讲解助你快速掌握【教程】

LinuxDNS解析慢怎么办_缓存与配置优化解析【技巧】

Linux容器环境怎么部署_最佳实践总结助你快速突破【技巧】

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部