专利号:2022102114872
本发明公开了一种舰载机保障人员调度方法,应对甲板舰载机保障作业调度的不确定突发状况。首先将保障人员对舰载机的保障过程构造为马尔科夫决策过程;随后根据该过程特点设计一种改进的Soft Actor Critic(SAC)调度算法:(1)为降低学习难度,将SAC算法拓展为多智能体算法,并添加环境数据处理,减少智能体需处理的环境状态信息;(2)为避免动作冲突情况,设计自适应率以增加调度质量;(3)为优化整体训练过程,设置无效动作屏蔽机制、优先经验回放机制。最后将设计好的算法投入训练,完成训练的智能体即可投入调度。该方法能够较好地应对甲板出现的紧急突发状况,使得甲板调度对于不确定性有着更强的鲁棒性,增加了甲板调度的效率。