RUDDER: Return Decomposition for Delayed Rewards

Feb-11-2026, 13:56:14 GMT–Neural Information Processing Systems

reinforcement learning; delayed reward; reward redistribution; return decomposition; bias-variance; credit assignment; LSTM

infinitesimal change, reward redistribution, rudder, (13 more...)

Neural Information Processing Systems

Feb-11-2026, 13:56:14 GMT

Conferences PDF

Industry:
- Leisure & Entertainment > Games (0.35)

Technology:
- Information Technology > Artificial Intelligence > Machine Learning > Neural Networks > Deep Learning (0.61)

Duplicate Docs Excel Report

Title
RUDDER: Return Decomposition for Delayed Rewards

Similar Docs Excel Report more

Title	Similarity	Source
None found