课程介绍:
强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
课程内容从强化学习的基础到进阶实战,每个阶段都有非常详细的指导和教学,可以很好的加深同学们对强化学习框架,网络流程,运行策略的理解,从宏观到细节,特别细致,对于想要快速在工作中运用强化学习的同学很有帮助。
课程目录:
10-1 PyTorch框架发展趋势简介.mp4 10-2 框架安装方法(CPU与GPU版本).mp4 10-3 PyTorch基本操作简介.mp4 10-4 自动求导机制.mp4 10-5 线性回归DEMO-数据与参数配置.mp4 10-6 线性回归DEMO-训练回归模型.mp4 10-7 常见tensor格式.mp4 10-8 Hub模块简介.mp4 11-1 卷积网络参数定义.mp4 11-10 加载训练好的网络模型.mp4 11-11 优化器模块配置.mp4 11-12 实现训练模块.mp4 11-13 训练结果与模型保存.mp4 11-14 加载模型对测试数据进行预测.mp4 11-15 额外补充-Resnet论文解读.mp4 11-16 额外补充-Resnet网络架构解读.mp4 11-2 网络流程解读.mp4 11-3 Vision模块功能解读.mp4 11-4 分类任务数据集定义与配置.mp4 11-5 图像增强的作用.mp4 11-6 数据预处理与数据增强模块.mp4 11-7 Batch数据制作.mp4 11-8 迁移学习的目标.mp4 11-9 迁移学习策略.mp4 1-2 一张图通俗解释强化学习.mp4 1-3 强化学习的指导依据.mp4 1-4 强化学习AI游戏DEMO.mp4 1-5 应用领域简介.mp4 1-6 强化学习工作流程.mp4 1-7 计算机眼中的状态与行为.mp4 2-1 基本情况介绍.mp4 2-2 与环境交互得到所需数据.mp4 2-3 要完成的目标分析.mp4 2-4 策略梯度推导.mp4 2-5 baseline方法.mp4 2-6 OnPolicy与OffPolicy策略.mp4 2-7 importance sampling的作用.mp4 2-8 PPO算法整体思路解析.mp4 3-1 Critic的作用与效果.mp4 3-2 PPO2版本公式解读.mp4 3-3 参数与网络结构定义.mp4 3-4 得到动作结果.mp4 3-5 奖励获得与计算.mp4 3-6 参数迭代与更新.mp4 4-1 算法原理通俗解读.mp4 4-2 目标函数与公式解析.mp4 4-3 Qlearning算法实例解读.mp4 4-4 Q值迭代求解.mp4 4-5 DQN简介.mp4 5-1 整体任务流程演示.mp4 5-2 探索与action获取.mp4 5-3 计算target值.mp4 5-4 训练与更新.mp4 6-1 DoubleDqn要解决的问题.mp4 6-2 DuelingDqn改进方法.mp4 6-3 Dueling整体网络架构分析.mp4 6-4 MultiSetp策略.mp4 6-5 连续动作处理方法.mp4 7-1 AC算法回顾与知识点总结.mp4 7-2 优势函数解读与分析.mp4 7-3 计算流程实例.mp4 7-4 A3C整体架构分析.mp4 7-5 损失函数整理.mp4 8-1 整体流程与环境配置.mp4 8-2 启动游戏环境.mp4 8-3 初始化局部模型并加载参数.mp4 8-4 要计算的指标回顾.mp4 8-5 与环境交互得到训练数据.mp4 8-6 训练网络模型.mp4 9-1 卷积神经网络应用领域.mp4 9-10 VGG网络架构.mp4 9-11 残差网络Resnet.mp4 9-12 感受野的作用.mp4 9-2 卷积的作用.mp4 9-3 卷积特征值计算方法.mp4 9-4 得到特征图表示.mp4 9-5 步长与卷积核大小对结果的影响.mp4 9-6 边缘填充方法.mp4 9-7 特征图尺寸计算与参数共享.mp4 9-8 池化层的作用.mp4 9-9 整体网络架构.mp4 课件 课件\第八章:A3C算法玩转超级马里奥.zip 课件\第二章:PPO算法与公式推导.pdf 课件\第七章:Actor-Critic算法分析(A3C).pdf 课件\第三章:策略梯度实战-月球登陆器训练实例.zip 课件\第四章:DQN算法.pdf 课件\第五章:DQN算法实例演示.zip 课件\第一章:强化学习简介及其应用.pdf
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!(gm@juziliao.com)
2. 分享目的仅供大家学习和交流,请不要用于商业用途!如需商用请联系原作者购买正版! 3.如有链接无法下载、失效或洽谈广告,请联系网站客服(微信:shangen0228)处理!