Jump to content

Machine learning terms/Reinforcement Learning: Difference between revisions

Newer edit →

Machine learning terms/Reinforcement Learning (view source)

Revision as of 16:45, 26 February 2023

516 bytes added , 26 February 2023

Created page with "*action *agent *Bellman equation *critic *Deep Q-Network (DQN) *DQN *environment *episode *epsilon greedy policy *experience replay *greedy policy *Markov decision process (MDP) *Markov property *policy *Q-function *Q-learning *random policy *reinforcement learning (RL) *replay buffer *return *reward *state *state-action value function *tabular Q-learning *target network *..."

Interface administrators, Administrators (Semantic MediaWiki), Curators (Semantic MediaWiki), Editors (Semantic MediaWiki), Suppressors, Administrators

8,021

edits

Retrieved from "https://aiwiki.ai/wiki/Special:MobileDiff/2141"