MATLAB强化学习工具箱整理(matlab classification工具箱)

MATLAB强化学习工具箱整理(matlab classification工具箱)

● 在使用MATLAB强化学习工具箱时我们主要思考的env和agent两个方面。

● 首先看env,MATLAB提供了几个已经搭建好的,只要

env = rlPredefinedEnv(env名字)

env名字可以选择以下几个

BasicGridWorld

简单的网格环境

MATLAB强化学习工具箱整理(matlab classification工具箱)

CartPole-Discrete

离散型外力输入值的倒立摆

CartPole-Continuous

连续型外力输入值的倒立摆

MATLAB强化学习工具箱整理(matlab classification工具箱)

DoubleIntegrator-Discrete

DoubleIntegrator-Continuous

一个木块在木板上滑动,就是这样

SimplePendulumWithImage-Discrete

SimplePendulumWithImage-Continuous

一根摆杆,可以观测到图像

MATLAB强化学习工具箱整理(matlab classification工具箱)

WaterFallGridWorld-Stochastic

WaterFallGridWorld-Deterministic

一个逆水行舟的网格环境,全局有外力在把agent往回推

其中网格环境是可以从空网格自定义起点终点障碍物的,也可以添加全局外力,甚至跳跃障碍物的特殊功能

还有2个是simulink搭建的环境模型

SimplePendulumModel-Discrete

SimplePendulumModel-Continuous

CartPoleSimscapeModel-Discrete

CartPoleSimscapeModel-Continuous

功能上和m语言搭建的一致

除了上面说的用基础网格搭建环境,还可以搭建复杂环境,需要注意的是这样几点

初始化,设定环境的输入输出,根据情况选择离散还是连续,维度也要在这里确定

执行一步,计算输出,reward,是否结束

绘图,重点关注是否绘图,因为训练过程每次都绘图严重降低效率

另外我们还试验成功了调用Python搭建强化学习环境的方法MATLAB调用pygame实现强化学习环境

● 接着就是agent了,可以完全自行编程实现,但这就失去了使用MATLAB的意义,要是整个功能都是在使用m语言基础函数构建,真的不要用MATLAB,隔壁python真香

提供的agent有这样的几个(排名不分先后,以字母序)

rlACAgent | rlDDPGAgent | rlDQNAgent | rlPGAgent | rlQAgent | rlSARSAAgent

其中rlQAgent和rlSARSAAgent只能在输入输出都是离散型而且维度较小时使用

如果在构建agent时需要搭建神经网络,直接编写的话基本上就是一句一层,基础的

卷基层convolution2dLayer,

池化层averagePooling2dLayer

全连接层fullyConnectedLayer,

一句添加一层

也可以打开Deep Network Designer工具界面操作来搭建网络结构

MATLAB强化学习工具箱整理(matlab classification工具箱)

这个工具的使用和simulink一样,从左边拖拽想要的网络层到中间,在右边设置参数,连接起来就可以导出网络结构了

MATLAB强化学习工具箱整理(matlab classification工具箱)

帮你学MatLab

微信号:MatLab_helper

MATLAB强化学习工具箱整理(matlab classification工具箱)MATLAB强化学习工具箱整理(matlab classification工具箱)

长按识别二维码关注我们

京云律所-东台站 京云律所-兴安站 京云律所-龙岩站 京云律所-原平站 京云律所-泉州站 京云律所-五常站 京云律所-冷水江站 京云律所-怀化站 京云律所-牡丹江站 京云律所-赣州站 京云律所-海东站 京云律所-深圳站 京云律所-黔西南布依族站 京云律所-唐山站 京云律所-海宁站 京云律所-辛集站 京云律所-临江站 京云律所-林芝站 京云律所-霍林郭勒站 京云律所-射洪站 京云律所-高碑店站 京云律所-阿坝站 京云律所-恩施站 京云律所-开原站 京云律所-阆中站 京云律所-临清站 京云律所-瑞昌站 京云律所-康定站 京云律所-平度站 京云律所-龙港站 京云律所-临沂站 京云律所-阿图什站 京云律所-宁德站 京云律所-柳州站 京云律所-宜城站 京云律所-邛崃站 京云律所-临夏站 京云律所-雷州站 京云律所-龙南站 京云律所-永安站 京云律所-安陆站 京云律所-孝义站 京云律所-石狮站 京云律所-乌兰察布站 京云律所-吉首站 京云律所-克孜勒苏站 京云律所-津市站 京云律所-文山壮族站 京云律所-台山站 京云律所-永城站 京云律所-新密站 京云律所-贵港站 京云律所-青州站 京云律所-乌苏站 京云律所-连云港站 京云律所-高邮站 京云律所-卫辉站 京云律所-绥化站 京云律所-扬州站 京云律所-营口站 京云律所-呼和浩特站 京云律所-清远站 京云律所-凤城站 京云律所-崇左站 京云律所-资兴站 京云律所-太仓站 京云律所-荆州站 京云律所-肥城站 京云律所-池州站 京云律所-鹰潭站 京云律所-晋城站 京云律所-随州站 京云律所-虎林站 京云律所-玉树站 京云律所-邯郸站 京云律所-广德站 京云律所-济南站 京云律所-长治站 京云律所-广安站 京云律所-武夷山站 京云律所-淄博站 京云律所-任丘站 京云律所-大同站 京云律所-丹江口站 京云律所-沙河站 京云律所-黄南站 京云律所-新泰站 京云律所-张家口站 京云律所-平果站 京云律所-绥芬河站 京云律所-利川站 京云律所-湘潭站 京云律所-错那站 京云律所-英德站 京云律所-敦化站 京云律所-武穴站 京云律所-驻马店站 京云律所-简阳站 京云律所-嫩江站 京云律所-湖州站

免责声明:文章内容来自互联网,本站仅提供信息存储空间服务,真实性请自行鉴别,本站不承担任何责任,如有侵权等情况,请与本站联系删除。

(0)
上一篇 2023-05-20 13:35:16
支持向量机(svm)原理及其matlab实现(支持向量机r)
下一篇 2023-05-20 13:36:34

联系我们

在线咨询: QQ交谈

邮件:362039258#qq.com(把#换成@)

工作时间:周一至周五,10:30-16:30,节假日休息。