Divergence-Augmented Policy Optimization

Qing Wang, Yingru Li, Jiechao Xiong, Tong Zhang

Feb-14-2026, 03:45:53 GMT–Neural Information Processing Systems

In deep reinforcement learning, policy optimization methods need to deal with issues such asfunction approximation andthereuse ofoff-policydata.

artificial intelligence, machine learning, reinforcement learning, (16 more...)

Neural Information Processing Systems

Feb-14-2026, 03:45:53 GMT

Conferences PDF

Country:
- North America
  - United States > Illinois
    - Cook County > Chicago (0.04)
  - Canada > British Columbia
    - Metro Vancouver Regional District > Vancouver (0.04)
- Europe
  - United Kingdom > England
    - Cambridgeshire > Cambridge (0.04)
  - Hungary > Budapest
    - Budapest (0.04)
- Asia
  - Middle East > Jordan (0.04)
  - China > Guangdong Province
    - Shenzhen (0.05)
    - Guangzhou (0.04)

Technology:
- Information Technology > Artificial Intelligence > Machine Learning > Reinforcement Learning (0.88)

Duplicate Docs Excel Report

Title
Divergence-Augmented Policy Optimization

Similar Docs Excel Report more

Title	Similarity	Source
None found