Sample-Based Planning for Continuous Action Markov Decision Processes

Mansley, Chris (Rutgers University) | Weinstein, Ari (Rutgers University) | Littman, Michael (Rutgers University)

May-18-2011–AAAI Conferences

In this paper, we present a new algorithm that integrates recent advances in solving continuous bandit problems with sample-based rollout methods for planning in Markov Decision Processes (MDPs). Our algorithm, Hierarchical Optimistic Optimization applied to Trees (HOOT) addresses planning in continuous-action MDPs. Empirical results are given that show that the performance of our algorithm meets or exceeds that of a similar discrete action planner by eliminating the problem of manual discretization of the action space.

action space, algorithm, discretization, (15 more...)

AAAI Conferences

May-18-2011

Conferences PDF

Add feedback

Country:
- North America > United States > New Jersey > Middlesex County > Piscataway (0.04)

Technology:
- Information Technology
  - Data Science > Data Mining
    - Big Data (0.69)
  - Artificial Intelligence
    - Representation & Reasoning > Planning & Scheduling (0.47)
    - Machine Learning > Learning Graphical Models
      - Undirected Networks > Markov Models (0.61)

Duplicate Docs Excel Report

Title
None found

Similar Docs Excel Report more

Title	Similarity	Source
None found