Passer à la navigation principale Passer à la recherche Passer au contenu principal

Asymptotically Optimal Strategies For Combinatorial Semi-Bandits in Polynomial Time

  • L2S, CNRS, Univ Paris-Sud
  • Orange Labs

Résultats de recherche: Contribution à un journalArticle de conférenceRevue par des pairs

Résumé

We consider combinatorial semi-bandits with uncorrelated Gaussian rewards. In this article, we propose the first method, to the best of our knowledge, that enables to compute the solution of the Graves-Lai optimization problem in polynomial time for many combinatorial structures of interest. In turn, this immediately yields the first known approach to implement asymptotically optimal algorithms in polynomial time for combinatorial semi-bandits.

langue originaleAnglais
Pages (de - à)505-528
Nombre de pages24
journalProceedings of Machine Learning Research
Volume132
étatPublié - 1 janv. 2021
Modification externeOui
Evénement32nd International Conference on Algorithmic Learning Theory, ALT 2021 - Virtual, Online
Durée: 16 mars 202119 mars 2021

Empreinte digitale

Examiner les sujets de recherche de « Asymptotically Optimal Strategies For Combinatorial Semi-Bandits in Polynomial Time ». Ensemble, ils forment une empreinte digitale unique.

Contient cette citation