OptimalAlgorithmsforStochasticMulti-Armed BanditswithHeavyTailedRewards

Feb-8-2026, 14:57:23 GMT–Neural Information Processing Systems

We also find the optimal hyperparameters for each perturbation, which can achieve the minimax optimal regret bound with respect to total rounds.

artificial intelligence, estimator, machine learning, (19 more...)

Neural Information Processing Systems

Feb-8-2026, 14:57:23 GMT

Conferences PDF

Country:
- North America > Canada > British Columbia > Metro Vancouver Regional District > Vancouver (0.04)

Technology:
- Information Technology > Artificial Intelligence
  - Machine Learning (0.68)
  - Representation & Reasoning (0.48)

Duplicate Docs Excel Report

Title
Optimal Algorithms for Stochastic Multi-Armed Bandits with Heavy Tailed Rewards

Similar Docs Excel Report more

Title	Similarity	Source
None found