ExplainMySurprise: LearningEfficientLong-Term MemorybyPredictingUncertainOutcomes

Feb-12-2026, 18:17:56 GMT–Neural Information Processing Systems

In many sequential tasks, a model needs to remember relevant events from the distant past to make correct predictions. Unfortunately, a straightforward application ofgradient based training requires intermediate computations tobestored for every element of a sequence. This requires to store prohibitively large intermediate data ifasequence consists ofthousands oreven millions elements, and asaresult, makeslearning ofverylong-term dependencies infeasible.

artificial intelligence, machine learning, urlhttp, (18 more...)

Neural Information Processing Systems

Feb-12-2026, 18:17:56 GMT

Conferences PDF

Add feedback

Country:
- Asia > Russia (0.05)
- Africa > Ethiopia (0.04)
- Oceania > Australia
  - New South Wales > Sydney (0.04)
- North America
  - United States > California
    - San Francisco County > San Francisco (0.14)
    - Los Angeles County > Long Beach (0.04)
  - Canada
    - Quebec > Montreal (0.04)
    - British Columbia > Metro Vancouver Regional District
      - Vancouver (0.14)
- Europe
  - Sweden > Stockholm
    - Stockholm (0.04)
  - Russia > Central Federal District
    - Moscow Oblast > Moscow (0.05)

Technology:
- Information Technology > Artificial Intelligence > Machine Learning > Neural Networks > Deep Learning (0.71)

Duplicate Docs Excel Report

Title
Explain My Surprise: Learning Efficient Long-Term Memory by Predicting Uncertain Outcomes

Similar Docs Excel Report more

Title	Similarity	Source
None found