G検定模擬試験set1 - 未解答
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
全ての欠損値が完全に生じている場合には,様々な手法を使ってこれに対処することができる.1 つは欠損があるサンプルをそのまま削除してしまう (ア) である.これは欠損に偏りがあった場合には,データ全体の傾向を大きく変えてしまうことになるので使用する際には欠損に特定の偏りがないかを確認して使用することが肝要である. 他の事例としては,欠損しているある特徴量と相関が強い他の特徴量が存在している場合は,(イ) という方法もある.
(解説あり)(イ)に当てはまらない選択肢を 1 つ選べ.
畳み込みニューラルネットワークは,畳み込み層とプーリング層を積み上げた構成をしている.画像データを用いた場合,畳み込み層では,出力画像のサイズを調整するために元の画像の周りを固定の値で埋める(ア)を行う.プーリング層では畳み込み層の出力を圧縮するプーリングを行う,(イ)などの手法がある.
(解説あり)(エ)に最もよくあてはまる選択肢を 1 つ選べ.
大規模なディープニューラルネットワーク(DNN)の学習では学習するべきパラメータ数が膨大となるため,処理の高速化が必要となる.2012 年に提案された分散並列技術である(ア)や画像処理に特化したプロセッサの(イ)は大規模なニューラルネットワークの学習を実現するために利用されてきた.また,大規模なニューラルネットワークの学習が困難となる原因の一つとして,ある層の入力がそれより下層の学習が進むにつれて変化する(ウ)がある.(ウ)を防ぐために出力値の分布の偏りを抑制する(エ)が 2015 年に提案されている.
(解説あり)(ア)にあてはまらない選択肢を 1 つ選べ.
ニューラルネットワークには(ア)などの多くのハイパーパラメータが存在し,これらの値が精度に大きな影響を与える.ハイパーパラメータのチューニング方法としては,パラメータの候補値を指定し,それらの組み合わせを調べる(イ)などがある.また,近年は,ハイパーパラメータを含め最適化問題とする(ウ)が効率的なチューニング方法として注目をあびている.
(解説あり)(ア)に最もよくあてはまる選択肢を 1 つ選べ.
機械学習の分野において有名な二つの定理について扱う.(ア)は,認知できる全ての客観的な特徴に基づくと全ての対象は同程度に類似している,つまり特徴を選択しなければ表現の類似度に基づく分類は不可能であることを示している.(イ)は,全てのタスクに対して常に他よりすぐれている万能的なアルゴリズムは存在しないことを示している.
(解説あり)(ア)に最もよくあてはまる選択肢を 1 つ選べ.
自動運転レベル 5 に至るには,2 つのアプローチが存在している.1 つは自動運転レベル 1 から徐々に運転自動化の範囲を広げていくアプローチ,もう 1 つは直接レベル 3 以上の自動運転を目指そうとするものである.この時,前者のレベル 1 から徐々に運転自動化を目指すアプローチを採っているプレイヤーは (ア) などである.他方で,後者の直接レベル 3 以上の運転自動化を目指すアプローチを採っているプレイヤーは大手IT企業である.また後者のアプローチを採る企業として著名なのは,google 社傘下の Waymo 社である.
(解説あり)(イ)に最もよくあてはまる選択肢を 1 つ選べ.
ニューラルネットワークは高い表現力を持つ反面,過学習をしやすいという性質を持つため,それを改善させる方法が多数考案されている.例えば,学習の際に一部のノードを無効化する(ア),一部の層の出力を正規化する(イ),データの水増しをしてデータの不足を補う(ウ),パラメータのノルムにペナルティを課す(エ)などがそれに当たる.
(イ)に当てはまらない選択肢を 1 つ選べ.
ディープラーニングは,ニューラルネットワークを多層化したものであり,観測データから本質的な情報である(ア)を自動的に抽出できる点が特徴である.また,従来の機械学習手法と比べると,(イ)という性質も持っている.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
教師なし学習の中で有名なものとして,未知の集合をいくつかの集まりに分類させる(ア)という学習方法と,正常な行為がどのようなものかを学習し,それと大きく異なるものを識別する(イ)がある.(ア)は特に(ウ)というアルゴリズムを使用して顧客の分類分けによる DM 配信やレコメンドを行うシステムなどに使用されている.(イ)は(エ)というアルゴリズムを基に,セキュリティシステムなどに使用されている.
loading!!