知识驱动的智能博弈对抗行动序列规划
2024-10-08 16:54
源自:北京科技大学机械工程学院
作者:陈哲涵 黎学臻
摘 要
针对基于深度强化学习方法解决实际博弈对抗序列规划问题中存在的探索 利用矛盾、奖赏信号稀疏、数据利用率低、难以稳定收敛等问题,分析了基于知识的学习型智能生成模式,提出基于知识驱动的方法,从用规则教、从数据中学、用问题引导等方面构建了智能博弈对抗行动序列规划模型,为提升探索 - 利用效率、精准奖励函数、加速算法收敛提供了理论支撑。对基于强化学习的智能博弈对抗问题求解的难点问题进行了讨论,指出下一步深度强化学习算法走向实用的发展方向。
关键词
深度强化学习, 博弈对抗, 知识驱动, 行动序列规划
1 博弈对抗行动序列规划研究现状
2 基于知识的学习型智能生成模式
3 知识驱动的深度强化学习博弈对抗行动序列生成
4 结论
声明:公众号转载的文章及图片出于非商业性的教育和科研目的供大家参考和探讨,并不意味着支持其观点或证实其内容的真实性。版权归原作者所有,如转载稿涉及版权等问题,请立即联系我们删除。
넶0