Reinforcement Learning
Reinforcement Learning
Reinforcement Learning 整個概念大概就如上圖 :
環境狀態 (State of Environment) 經由 機器觀察 (Observation of Machine) 後會做出一些行為 (Action) 來改變環境狀態。而改變後的環境狀態除了依舊會經由機器觀察促使 Machine 做出一些行為外,同時也會對 Machine 給予其獎賞 (Reward),因此,Reinforcement Learning 就是經由這些正負獎賞使 Machine 可以去學習如何採取 Action,讓 Reward 最大化。