强化学习涉及代理在环境中采取行动并根据其后果获得奖励或惩罚,从而学习最佳行为策略。它主要用于:

- 游戏

- 机器人控制

- 资源管理

常用的强化学习算法包括:

- Q学习

- SARSA

- DQN