G検定模擬試験set1 - 未解答
(ア)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングの学習の目的は,損失関数の値をできるだけ小さくするパラメータを見つけることである.このような問題を解くことを(ア)という.このパラメータを見つけるアルゴリズムとして有名なのは(イ) である.ただ,(イ)は対象の関数の形がある分布や方向に依存すると非効率な経路でパラメータを探索してしまい,学習に時間がかかってしまうというデメリットがある.そこで,現在では(イ)の欠点を改善するために(ウ) などのアルゴリズムが使用されている.
(オ)に最もよくあてはまる選択肢を 1 つ選べ.
機械が試行錯誤することで,取るべき最善の行動を決定する問題を扱うことができる学習方法を(ア)という.(ア)はボードゲームや自動運転,またロボットの歩行動作などに活用されている.代表的なアルゴリズムに (イ)があげられる.(ア)の課題として,主に(ウ)や(エ)などが挙げられる.理論的には無限に学習するが,実世界では全てが限られている.ロボットの場合,無限の試行を繰り返すことができず,損耗し,実験の続行が困難になる.そこで人間側がタスクを上手く切り分けてやさしいタスクからの学習をすることが期待される.また(エ)に関して,例として,2 体のロボット同士で学習を開始させようとすると,お互いに初期状態であるタスクについての何も知識がない状態だと,学習過程の不安定化が見られる.現在はこれに対応するために逆強化学習やディープラーニングの技術を適用した(オ)などが適用され始めている.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
ニューラルネットワークの学習は,損失関数(コスト関数)の最適化により行われる.そして,その損失関数は学習の目的に応じて決定する.よく使われる損失関数として,回帰問題には(ア),分類問題には(イ)がある.また分布を直接学習する際には(ウ)が用いられることもある.さらに,損失関数にパラメータの二乗ノルムを加えると(エ)となる.
(カ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングを含めて機械学習において精度の高い学習をするためには,観測データの適切な前処理が必須である.異なるスケールの特徴量を同時に扱えるようにするために,平均を 0 に分散を 1 に規格化する(ア)や,特徴量の線形結合からデータ内の分散が大きくなるような特徴量を得る(イ)などは広く利用されている.また,画像処理の分野においては,減算正規化と除算正規化の処理を行う(ウ)などが前処理として利用され,(エ)などの画像処理に特化したライブラリで行うことができる.また,自然言語処理の分野においては,文章に単語が含まれているかどうかを考えてテキストデータを数値化する(オ)や文章に含まれる単語の重要度を特徴量とする(カ)などがある.
(解説あり)(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
ニューラルネットワークは高い表現力を持つ反面,過学習をしやすいという性質を持つため,それを改善させる方法が多数考案されている.例えば,学習の際に一部のノードを無効化する(ア),一部の層の出力を正規化する(イ),データの水増しをしてデータの不足を補う(ウ),パラメータのノルムにペナルティを課す(エ)などがそれに当たる.
(キ)に最もよくあてはまる選択肢を 1 つ選べ.
線形モデルとは,(ア)を含む項の線形結合で,(ア)を含んだ数式の出力値は(イ)と呼ばれる.この線形結合で,特に(ア)も(イ)も一次元のデータの場合は,y = b0 + b1 * x と表される.こういったモデルを単回帰モデルと呼んだりもする.この数式において,各項の係数(例えば b0, b1)を(ウ)と呼び,このモデルを用いてテストデータを学習し,測定した実データを推定する.注意点として,(イ)が連続の値を取り扱う場合(エ)と呼ばれるが,離散の値を取り扱われる場合は(オ)と呼ばれ,それぞれ名称が異なる.ただ,実際のデータを扱うときに,(ア)が 1 次元であることはほとんどなく,2 次元以上になることが一般的である.このような場合,(ア)の次元数分だけ,係数パラメータを増やして,モデルを拡張する必要がある.このように(ア)が 2 つ以上の場合を(カ)モデルと呼び,各項の係数パラメータを(キ)という.またモデルによって出力された値と実際の測定値の誤差を(ク)という.この(ク)を用いて係数パラメータを推定する代表的なアルゴリズムに最小二乗法と最尤推定法がある.
(解説あり)(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
自然言語処理の研究においても,ディープラーニングを利用した研究が目立ちつつあるが,その成果は分野においてまちまちである. 例えば,機械翻訳 や(ア)おいては大幅な性能向上が見られる一方で,構文解析や(イ) のように連続的な精度向上は見られるものの基本的な手法は大きく変わらないもの,そして 文脈解析 や(ウ)など現在のアプローチでは実用的な精度は見込めないものなどがある.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
現在の教師あり学習は,与えられたデータがどの分類に当てはまるのかを識別する(ア)と,様々な関連性のある過去の数値から未知の数値を予測する(イ)という二つに分類される.(ア)を用いることで,(ウ)のようなことができる.また(イ)を用いることで,(エ)のようなことができる.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングの活用を進めていく必要性の高まりに対して,日本国内においてはそうした先端 IT 技術に精通した人材不足が懸念されている. 例えば,経済産業省が定めた先端 IT 人材がどのような人材需給状況にあるかの推定によると,2020 年には需給ギャップが広がり人材の不足は (ア) に及ぶと言われている. こうした人材不足を解消するべく,様々な方法で AI に理解のある人材育成が試みられている.そのような試みの一つとして,MOOCs は期待を寄せられている.著名な例としては,AI 研究の第一人者で,2014 年から 2017 年にかけて Baidu の AI 研究所所長を務めた (イ) が創業した Coursera などは入門から上級まで様々なレベルの AI 講義が開かれており,多くの受講者を惹きつけるに至っている.
loading!!