(computing theory) A model-free reinforcement learning algorithm to learn a policy telling an agent what action to take under what circumstances.
Q-learning
Q学習は、試行錯誤でQテーブルを更新することにより、未知の環境でエージェントが最適な行動を学習することを可能にします。
アカウントを持っていませんか? 新規登録
アカウントを持っていますか? ログイン
DiQt(ディクト)
無料
★★★★★★★★★★