ThompsonSamplingwithInformationRelaxation Penalties

Weconsider afinite-horizon multi-armed bandit (MAB) problem inaBayesian setting, for which we propose aninformation relaxation samplingframework.

Feb-14-2026, 19:58:27 GMT

Title
Thompson Sampling with Information Relaxation Penalties Seungki Min Columbia Business School Costis Maglaras Columbia Business School Ciamac C. Moallemi Columbia Business School

Title	Similarity	Source
None found