Two Time-scale Off-Policy TD Learning: Non-asymptotic Analysis over Markovian Samples

Tengyu Xu, Shaofeng Zou, Yingbin Liang

Aug-20-2025, 07:42:57 GMT–Neural Information Processing Systems

Neural Information Processing Systems http://nips.cc/

algorithm, convergence, stepsize, (15 more...)

Neural Information Processing Systems

Aug-20-2025, 07:42:57 GMT

Conferences PDF

Country:
- North America
  - United States
    - Ohio (0.04)
    - New York (0.04)
  - Canada
    - Alberta (0.14)
    - British Columbia > Metro Vancouver Regional District
      - Vancouver (0.04)

Genre:
- Research Report > New Finding (0.47)

Technology:
- Information Technology > Artificial Intelligence > Machine Learning > Reinforcement Learning (1.00)

Duplicate Docs Excel Report

Title
Two Time-scale Off-Policy TD Learning: Non-asymptotic Analysis over Markovian Samples

Similar Docs Excel Report more

Title	Similarity	Source
None found