G検定模擬試験set1 - 未解答
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
自己符号化器(Autoencoder)は,出力が入力と同じものに近づくことを目指して学習する.(ア)のアルゴリズムであり,(イ)が可能になる.このときの(ウ)が入力の特徴を抽出した表現となる.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
機械学習による分析を行う際,カテゴリーデータをそのまま扱うのは非常に難しい.このため,これを数値に変換して扱いやすくすることが一般的である. ドリンクのサイズ S, M, L などの順序を持つ文字列のカテゴリーデータの場合,それぞれの値に対応する数値を辞書型データで用意し,これを数値に変化する方法 (ア) を利用して変換を行うことがある. また順序を持たない名義特徴量のカテゴリーデータについては,各変数に対応したダミー変数を新たに作り出す (イ) が有用である.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
ニューラルネットワークで用いられる活性化関数について扱う.出力層の活性化関数には,回帰では(ア)が,多クラス分類では(イ)が一般的に利用されてきた.また中間層の活性化関数として,従来は(ウ)などが一般的に利用されてきた.しかし,これらの活性化関数を利用すると勾配消失問題が起きやすいという問題があったため,近年は,入力が 0 を超えていれば入力をそのまま出力に渡し,0 未満であれば出力を 0 とする(エ)や複数の線形関数の中での最大値を利用する(オ)などが利用されている.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
既存の学習済みニューラルネットワークモデルを活用する手法に(ア)と(イ)がある.(ア)では,学習済みモデルに対して新たに別の課題を学習させることで,少量のデータセットかつ少ない計算量で高い性能のモデルを得ることができる.また,(イ)は,学習済みの大規模モデルの入力と出力を小規模なモデルの教師データとして利用することで,少ない計算資源で従来のモデルと同程度の性能を実現することが可能となる.
(オ)に最もよくあてはまる選択肢を 1 つ選べ.
機械学習の手法は学習の枠組みに応じて主に三つに分類することができる. (ア)は入力とそれに対する出力のペアの集合を学習用データとする手法で,(イ)などが(ア)に含まれる.(ウ)は入力の集合だけから学習を行う手法であり,(エ)などが(ウ)に含まれる.最後に(オ)は,最終結果または連続した行動の結果に対して報酬を与え,報酬ができるだけ大きくなるような行動を探索する手法である.
(解説あり)(イ)に最もよくあてはまる選択肢を 1 つ選べ.
ニューラルネットワークには(ア)などの多くのハイパーパラメータが存在し,これらの値が精度に大きな影響を与える.ハイパーパラメータのチューニング方法としては,パラメータの候補値を指定し,それらの組み合わせを調べる(イ)などがある.また,近年は,ハイパーパラメータを含め最適化問題とする(ウ)が効率的なチューニング方法として注目をあびている.
(解説あり)(ア)に最もよくあてはまる選択肢を 1 つ選べ.
ニューラルネットワークは高い表現力を持つ反面,過学習をしやすいという性質を持つため,それを改善させる方法が多数考案されている.例えば,学習の際に一部のノードを無効化する(ア),一部の層の出力を正規化する(イ),データの水増しをしてデータの不足を補う(ウ),パラメータのノルムにペナルティを課す(エ)などがそれに当たる.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングはソフトウェアフレームワークを利用して実装するのが一般的である.多層のニューラルネットワークモデルを定義し,データを用いて学習・予測を実行するのがフレームワークの役割だが,重要なのはネットワークの記述方法とその柔軟性である.ネットワークには大きく分けて 二つの記述方法がある.一つ目は(ア)による記述方法である.これらの記述方法を採用しているソフトウェアには(イ)があげられる.この方法を用いることによって,モデルの定義がテキストで設定でき,簡単に学習を開始させることが出来るというメリットがある.一方で,ループ構造をもつような RNN など,複雑なモデルを扱う際には,モデルの定義を記述することは難しくなる傾向にある.二つ目は(ウ)による記述方法である.代表的なフレームワークとして(エ)があげられる.一度書き方を覚えてしまえば,複雑なモデルでも比較的簡単に記述することが出来るが,モデルは,それぞれのフレームワーク固有のソースコードで出来上がるため,モデルが使用しているソフトウェアに依存してしまうという問題がある.
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
画像データに対しては,前処理を施すことが多い.カラー画像を白黒画像に変換して計算量を削減する(ア)や,細かいノイズの影響を除去する(イ),画素ごとの明るさをスケーリングする(ウ)などがこれに含まれる.
(ウ)に当てはまらない選択肢を 1 つ選べ.
ニューラルネットワークで用いられる活性化関数について扱う.出力層の活性化関数には,回帰では(ア)が,多クラス分類では(イ)が一般的に利用されてきた.また中間層の活性化関数として,従来は(ウ)などが一般的に利用されてきた.しかし,これらの活性化関数を利用すると勾配消失問題が起きやすいという問題があったため,近年は,入力が 0 を超えていれば入力をそのまま出力に渡し,0 未満であれば出力を 0 とする(エ)や複数の線形関数の中での最大値を利用する(オ)などが利用されている.
loading!!