Expert-Supervised ReinforcementLearningfor OfflinePolicyLearningandEvaluation

Feb-19-2026, 07:58:40 GMT–Neural Information Processing Systems

Sample efficiencyof ESRL is independent of the chosen risk aversion threshold and quality of the behavior policy.

artificial intelligence, machine learning, reinforcement learning, (18 more...)

Neural Information Processing Systems

Feb-19-2026, 07:58:40 GMT

Conferences PDF

Country:
- North America
  - United States > Massachusetts
    - Middlesex County > Cambridge (0.04)
  - Canada > British Columbia
    - Metro Vancouver Regional District > Vancouver (0.04)
- Europe > United Kingdom
  - England (0.04)

Technology:
- Information Technology > Artificial Intelligence
  - Representation & Reasoning (0.95)
  - Machine Learning > Reinforcement Learning (0.70)

Duplicate Docs Excel Report

Title
Expert-Supervised Reinforcement Learning for Offline Policy Learning and Evaluation

Similar Docs Excel Report more

Title	Similarity	Source
None found