这份由张志华老师提供的PPT资源,以清晰的思路梳理了从马尔可夫决策过程 (Markov Decision Processes) 到强化学习 (Reinforcement Learning),再到深度强化学习 (Deep Reinforcement Learning) 的核心概念和方法,推荐学习!