Surrogate Objectives for Batch Policy Optimization in One-step Decision Making

Minmin Chen, Ramki Gummadi, Chris Harris, Dale Schuurmans

Feb-12-2026, 19:23:21 GMT–Neural Information Processing Systems

Whenrewardsare fully observed, we show that the expected reward objectiveexhibits suboptimal plateaus and exponentially many local optima in the worst case.

artificial intelligence, machine learning, objective, (14 more...)

Neural Information Processing Systems

Feb-12-2026, 19:23:21 GMT

Conferences PDF

Country:
- North America > Canada
  - British Columbia > Metro Vancouver Regional District > Vancouver (0.04)
- Asia > Middle East
  - Jordan (0.05)

Technology:
- Information Technology > Artificial Intelligence > Machine Learning (1.00)

Duplicate Docs Excel Report

Title
Surrogate Objectives for Batch Policy Optimization in One-step Decision Making

Similar Docs Excel Report more

Title	Similarity	Source
None found