検索内容:
研究者は各アームについて達成可能な報酬の指標を計算し、それを使って次にどのアームを探索するかを決め、複数のバンディット戦略を比較した。
研究者は複数のギッティンズ指数を比較して、多腕バンディット問題で次にどの腕を試すべきかを決めた。
アカウントを持っていませんか? 新規登録
アカウントを持っていますか? ログイン
DiQt(ディクト)
無料
★★★★★★★★★★