Reduced Policy Optimization for Continuous Control with Hard Constraints Shutong Ding Jingya Wang 1 Ye Shi

Mar-27-2025, 06:26:55 GMT–Neural Information Processing Systems

Recent advances in constrained reinforcement learning (RL) have endowed reinforcement learning with certain safety guarantees. However, deploying existing constrained RL algorithms in continuous control tasks with general hard constraints remains challenging, particularly in those situations with non-convex hard constraints. Inspired by the generalized reduced gradient (GRG) algorithm, a classical constrained optimization technique, we propose a reduced policy optimization (RPO) algorithm that combines RL with GRG to address general hard constraints.

constraint, machine learning, reinforcement learning, (17 more...)

Neural Information Processing Systems

Mar-27-2025, 06:26:55 GMT

Conferences PDF

Add feedback

Country:
- North America > United States (0.28)

Industry:
- Automobiles & Trucks (0.93)
- Energy
  - Power Industry (1.00)
  - Renewable (0.67)
- Transportation
  - Electric Vehicle (0.67)
  - Ground > Road (0.93)

Technology:
- Information Technology > Artificial Intelligence
  - Machine Learning > Reinforcement Learning (1.00)
  - Representation & Reasoning
    - Constraint-Based Reasoning (1.00)
    - Optimization (1.00)

Duplicate Docs Excel Report

Title
Reduced Policy Optimization for Continuous Control with Hard Constraints Shutong Ding Jingya Wang

Similar Docs Excel Report more

Title	Similarity	Source
None found