Finite-TimeAnalysisofRound-Robin Kullback-LeiblerUpperConfidenceBoundsfor OptimalAdaptiveAllocationwithMultiplePlaysand MarkovianRewards

Feb-8-2026, 12:46:35 GMT–Neural Information Processing Systems

Forouranalysis wedevise several concentration results forMarkovchains, including amaximal inequality for Markov chains, that may be of interest in their own right. As a byproduct of our analysis we also establish asymptotically optimal, finite-time guarantees for the case of multiple plays, and i.i.d.

artificial intelligence, data mining, machine learning, (20 more...)

Neural Information Processing Systems

Feb-8-2026, 12:46:35 GMT

Conferences PDF

Add feedback

Country:
- North America
  - United States
    - New Jersey > Hudson County
      - Hoboken (0.04)
    - California
      - Santa Clara County > Palo Alto (0.04)
      - Alameda County > Hayward (0.04)
  - Canada > British Columbia
    - Metro Vancouver Regional District > Vancouver (0.04)
- Europe
  - United Kingdom > England
    - Cambridgeshire > Cambridge (0.04)
  - Hungary > Budapest
    - Budapest (0.04)

Technology:
- Information Technology
  - Data Science > Data Mining
    - Big Data (0.31)
  - Artificial Intelligence
    - Representation & Reasoning (0.71)
    - Machine Learning > Learning Graphical Models
      - Undirected Networks > Markov Models (0.36)

Duplicate Docs Excel Report

Title
597c7b407a02cc0a92167e7a371eca25-Paper.pdf

Similar Docs Excel Report more

Title	Similarity	Source
None found