Successor Uncertainties: Exploration and Uncertainty in Temporal Difference Learning

David Janz, Jiri Hron, Przemysław Mazur, Katja Hofmann, José Miguel Hernández-Lobato, Sebastian Tschiatschek

Feb-11-2026, 14:47:15 GMT–Neural Information Processing Systems

Specifically,becauseaQfunctionis defined with respect toaparticular policy,constructingPˆQ requires selection ofareference policy or distribution over policies.

etal, machine learning, reinforcement learning, (14 more...)

Neural Information Processing Systems

Feb-11-2026, 14:47:15 GMT

Conferences PDF

Country:
- North America > Canada > British Columbia > Metro Vancouver Regional District > Vancouver (0.04)

Technology:
- Information Technology > Artificial Intelligence
  - Machine Learning > Reinforcement Learning (0.97)
  - Representation & Reasoning (0.70)

Duplicate Docs Excel Report

Title
Successor Uncertainties: Exploration and Uncertainty in Temporal Difference Learning

Similar Docs Excel Report more

Title	Similarity	Source
None found