Near-Optimal Time and Sample Complexities for Solving Markov Decision Processes with a Generative Model

Aaron Sidford, Mengdi Wang, Xian Wu, Lin Yang, Yinyu Ye

Nov-20-2025, 23:39:19 GMT–Neural Information Processing Systems

In this paper we consider the problem of computing an null -optimal policy of a discounted Markov Decision Process (DMDP) provided we can only access its transition function through a generative sampling model that given any state-action pair samples from the transition function in O (1) time.

algorithm, artificial intelligence, machine learning, (17 more...)

Neural Information Processing Systems

Nov-20-2025, 23:39:19 GMT

Conferences PDF

Add feedback

Country:
- Europe > United Kingdom
  - England > Greater London > London (0.04)
- North America
  - Canada (0.04)
  - United States
    - California > Santa Clara County
      - Palo Alto (0.04)
    - Massachusetts > Middlesex County
      - Belmont (0.04)
      - Cambridge (0.04)
    - New Jersey > Mercer County
      - Princeton (0.04)

Technology:
- Information Technology > Artificial Intelligence
  - Machine Learning > Learning Graphical Models
    - Undirected Networks > Markov Models (1.00)
  - Representation & Reasoning (1.00)

Duplicate Docs Excel Report

Title
Near-Optimal Time and Sample Complexities for Solving Markov Decision Processes with a Generative Model
Near-Optimal Time and Sample Complexities for Solving Markov Decision Processes with a Generative Model

Similar Docs Excel Report more

Title	Similarity	Source
None found