Efficient Recurrent Off-Policy RL Requires a Context-Encoder-Specific Learning Rate Fan-Ming Luo 1,2 Zuolin Tu

Oct-10-2025, 03:06:44 GMT–Neural Information Processing Systems

Recent progress has demonstrated that recurrent reinforcement learning (RL), which consists of a context encoder based on recurrent neural networks (RNNs) for unobservable state prediction and a multilayer perceptron (MLP) policy for decision making, can mitigate partial observability and serve as a robust baseline for POMDP tasks.

context encoder, international conference, resel, (15 more...)

Neural Information Processing Systems

Oct-10-2025, 03:06:44 GMT

Conferences PDF

Add feedback

Country:
- Oceania > Australia
  - Queensland > Brisbane (0.04)
  - New South Wales > Sydney (0.04)
- North America
  - United States
    - Maryland > Baltimore (0.04)
    - Michigan > Wayne County
      - Detroit (0.04)
    - Massachusetts > Middlesex County
      - Cambridge (0.04)
    - Louisiana > Orleans Parish
      - New Orleans (0.04)
    - California > Los Angeles County
      - Long Beach (0.04)
  - Puerto Rico > San Juan
    - San Juan (0.04)
  - Canada > Quebec
    - Montreal (0.04)
- Europe
  - Austria > Vienna (0.14)
  - Sweden (0.04)
  - Czechia > Prague (0.04)
  - United Kingdom > England
    - Greater London > London (0.04)
  - Portugal
    - Porto > Porto (0.04)
    - Braga > Braga (0.04)
  - France > Hauts-de-France
    - Nord > Lille (0.04)
- Asia
  - Middle East > Jordan (0.04)
  - China > Jiangsu Province
    - Nanjing (0.04)
- Africa
  - Rwanda > Kigali
    - Kigali (0.04)
  - Ethiopia > Addis Ababa
    - Addis Ababa (0.04)

Genre:
- Research Report
  - New Finding (1.00)
  - Experimental Study (0.93)

Industry:
- Information Technology (0.92)

Technology:
- Information Technology > Artificial Intelligence > Machine Learning
  - Reinforcement Learning (1.00)
  - Neural Networks > Deep Learning (1.00)
  - Learning Graphical Models > Undirected Networks
    - Markov Models (0.69)

Duplicate Docs Excel Report

Title
5706668422bd0d82588998ebe1067133-Paper-Conference.pdf

Similar Docs Excel Report more

Title	Similarity	Source
None found