Off-Policy IntervalEstimationwith LipschitzValueIteration

Feb-8-2026, 12:55:15 GMT–Neural Information Processing Systems

The current success of RL highly relies on excessive amount ofdata, which, however,isusually not available inmanyreal world tasks wheredeploying anew policyisverycostlyorevenrisky.

artificial intelligence, iteration, machine learning, (16 more...)

Neural Information Processing Systems

Feb-8-2026, 12:55:15 GMT

Conferences PDF

Country:
- North America
  - United States
    - Illinois (0.04)
    - Massachusetts > Middlesex County
      - Cambridge (0.04)
  - Canada > British Columbia
    - Metro Vancouver Regional District > Vancouver (0.04)

Industry:
- Health & Medicine (0.33)

Technology:
- Information Technology > Artificial Intelligence
  - Machine Learning (0.95)
  - Representation & Reasoning (0.68)

Duplicate Docs Excel Report

Title
Off-Policy Interval Estimation with Lipschitz Value Iteration

Similar Docs Excel Report more

Title	Similarity	Source
None found