Provably Efficient Q-learning with Function Approximation via Distribution Shift Error Checking Oracle

Simon S. Du, Yuping Luo, Ruosong Wang, Hanrui Zhang

Feb-11-2026, 23:36:43 GMT–Neural Information Processing Systems

The24], which Q-learning exploration Q-function Q-function asymptotically 39] derived drawbackof example, Zou39] require lowerbounded properties.

artificial intelligence, machine learning, reinforcement learning, (13 more...)

Neural Information Processing Systems

Feb-11-2026, 23:36:43 GMT

Conferences PDF

Country:
- North America
  - United States
    - New York (0.04)
    - Massachusetts > Middlesex County
      - Belmont (0.04)
  - Canada > British Columbia
    - Metro Vancouver Regional District > Vancouver (0.04)
- Europe > United Kingdom
  - England
    - Cambridgeshire > Cambridge (0.14)
    - Greater London > London (0.04)

Technology:
- Information Technology > Artificial Intelligence > Machine Learning > Reinforcement Learning (0.57)

Duplicate Docs Excel Report

Title
Provably Efficient Q-learning with Function Approximation via Distribution Shift Error Checking Oracle

Similar Docs Excel Report more

Title	Similarity	Source
None found