Stochasticity of Deterministic Gradient Descent: Large Learning Rate for Multiscale Objective Function

Oct-2-2025, 08:27:06 GMT–Neural Information Processing Systems

Consequently, the iteration of SGD, unlike GD, is not deterministic even when it is started at a fixed initial condition.

artificial intelligence, invariant distribution, machine learning, (15 more...)

Neural Information Processing Systems

Oct-2-2025, 08:27:06 GMT

Conferences PDF

Country:
- Asia > Middle East (0.14)

Technology:
- Information Technology > Artificial Intelligence
  - Representation & Reasoning > Optimization (0.46)
  - Machine Learning
    - Neural Networks (0.70)
    - Statistical Learning > Gradient Descent (0.53)

Duplicate Docs Excel Report

Title
1b9a80606d74d3da6db2f1274557e644-Paper.pdf

Similar Docs Excel Report more

Title	Similarity	Source
None found