最終更新日:2025/12/07
例文
研究チームは、限られた資源を競合する選択肢に配分し、時間経過とともに各選択肢の性質を学習しながら期待利得を最大化するアルゴリズムを実装し、どの広告バリエーションがクリック率を最大化するかを判定した。
復習用の問題
The research team implemented a multi-armed bandit to determine which advertisement variations would maximize click-through rates while learning user preferences over time.
正解を見る
The research team implemented a multi-armed bandit to determine which advertisement variations would maximize click-through rates while learning user preferences over time.
音声機能が動作しない場合はこちらをご確認ください
関連する単語
multi-armed bandit
名詞
(probability
theory,
machine
learning)
An
algorithm
that
allocates
a
fixed
limited
set
of
resources
between
competing
alternative
choices
so
as
to
maximize
the
expected
gain,
when
each
choice's
properties
are
only
partially
known
at
the
time
of
allocation,
and
may
become
better
understood
as
time
passes
or
allocations
are
made.
日本語の意味
限られた資源を複数の選択肢(腕)に配分し、各選択肢の特性が部分的にしか把握されていない状況で、期待される収益を最大化するためのアルゴリズムである。 / 実験と活用のバランスをとるため、各選択肢の性質が順次明らかになる中で、最適な選択を導くための手法と解釈できる。
関連語
項目の編集設定
- 項目の編集権限を持つユーザー - すべてのユーザー
- 項目の新規作成を審査する
- 項目の編集を審査する
- 項目の削除を審査する
- 重複の恐れのある項目名の追加を審査する
- 項目名の変更を審査する
- 審査に対する投票権限を持つユーザー - 編集者
- 決定に必要な投票数 - 1
例文の編集設定
- 例文の編集権限を持つユーザー - すべてのユーザー
- 例文の削除を審査する
- 審査に対する投票権限を持つユーザー - 編集者
- 決定に必要な投票数 - 1
問題の編集設定
- 問題の編集権限を持つユーザー - すべてのユーザー
- 審査に対する投票権限を持つユーザー - 編集者
- 決定に必要な投票数 - 1
