当前位置:首 页 > 公益服务 > G部--物理

基于深度强化学习的舰载机保障作业人员调度方法
添加时间:2023-11-03 浏览次数: 161

专利号:2021110090894

本发明公开了一种基于深度强化学习的舰载机保障作业人员调度方法,包括以下步骤:构建舰载机保障过程的马尔可夫决策过程(Markov Decision Process,MDP)模型,作为智能体训练环境;根据保障作业流程,确定智能体及其观测空间与动作空间;随后设计奖励函数、经验抽取机制和终止条件,并基于此设计网络结构;通过设置主要参数初始化环境,并采用多智能体深度确定策略梯度算法(Multi Agent Deep Deterministic Policy Gradient,MADDPG)训练智能体;最终使用完成训练智能体的决策辅助指挥人员进行保障作业人员调度。本发明可用于人员调度智能决策,将各类保障小组设定为智能体,辅助指挥人员和保障人员进行决策,提高保障作业决策效率,从而提高舰载机出动回收架次率。

友情链接
FRIENDSHIP LINK
国家知识产权局     中国商标网     山东省市场监督管理局     山东省知识产权事业发展中心     威海市市场监督管理局     威海经济技术开发区     中国法院网     中国打击侵权假冒工作网     中国知识产权维权援助网     中国技术交易所     中国版权保护中心     中国保护知识产权网     山东省科技成果转化服务平台    
地址:山东省威海市经济技术开发区皇冠街道香港路17-5号智慧谷A3号201   电话:0631-5232559  鲁ICP备2022019351号-1 鲁公网安备37100002001122