Deep Deterministic Policy Gradient

Policy Gradient에 대한 간단한 소개에 이어, Actor-Critic을 소개하면서 policy gradient에 관한 RL의 기본적인 내용은 기술하였다고 생각한다. 이 방법은 RL분야에서 가장 중요한 방법중의 하나로 널리 사용되고 있으므로 발표된지 오래되었지만 중요한 논문은 정리를 해야할 필요가 있다고 생각한다. 이번에 소개할 논문은 policy gradient theorem에서 파생된 이론으로 RL분야에서는 활용성이 높은 기술이다. Continuous control with deep reinforcement learning 논문 제목이… Deep Deterministic Policy Gradient 계속 읽기