Global Policy Construction in Modular Reinforcement Learning

Zhang, Ruohan (The University of Texas at Austin) | Song, Zhao (The University of Texas at Austin) | Ballard, Dana H. (The University of Texas at Austin)

Mar-6-2015–AAAI Conferences

We propose a modular reinforcement learning algorithm which decomposes a Markov decision process into independent modules. Each module is trained using Sarsa(lambda). We introduce three algorithms for forming global policy from modules policies, and demonstrate our results using a 2D grid world.

artificial intelligence, machine learning, reinforcement learning, (13 more...)

AAAI Conferences

Mar-6-2015

Conferences PDF

Add feedback

Country:
- North America > United States > Texas > Travis County > Austin (0.15)

Technology:
- Information Technology > Artificial Intelligence > Machine Learning > Reinforcement Learning (1.00)

Duplicate Docs Excel Report

Title
None found

Similar Docs Excel Report more

Title	Similarity	Source
None found