G検定模擬試験set1
(ア)に最もよくあてはまる選択肢を 1 つ選べ.
画像の認識では,主に入力から出力に向かう結合のみを持つ階層的なニューラルネットワーク,特に画像などの信号に内在する局所的な特徴が集まって,より大域的な特徴を構成するという構造を反映した,(ア)がよく用いられる.一方,自然言語テキストや動画に代表される構造を持った系列情報を扱うために(イ)が用いられている.特にケプラー大学のゼップ・ホフレイターの提案した(ウ)は必要な文脈情報の長さを適応的に制御することで,時間を遡る誤差逆伝播の可能性を向上させ,画像からの説明文の生成や機械翻訳など,多くの課題に適用されている.実際,2016 年秋に,google 社は google 翻訳に(ウ)を取り入れてアップデートし,非常に高精度な翻訳を提供することが可能になった.
(解説あり)(イ)に最もよくあてはまる選択肢を 1 つ選べ.
ニューラルネットワークには(ア)などの多くのハイパーパラメータが存在し,これらの値が精度に大きな影響を与える.ハイパーパラメータのチューニング方法としては,パラメータの候補値を指定し,それらの組み合わせを調べる(イ)などがある.また,近年は,ハイパーパラメータを含め最適化問題とする(ウ)が効率的なチューニング方法として注目をあびている.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
機械が試行錯誤することで,取るべき最善の行動を決定する問題を扱うことができる学習方法を(ア)という.(ア)はボードゲームや自動運転,またロボットの歩行動作などに活用されている.代表的なアルゴリズムに (イ)があげられる.(ア)の課題として,主に(ウ)や(エ)などが挙げられる.理論的には無限に学習するが,実世界では全てが限られている.ロボットの場合,無限の試行を繰り返すことができず,損耗し,実験の続行が困難になる.そこで人間側がタスクを上手く切り分けてやさしいタスクからの学習をすることが期待される.また(エ)に関して,例として,2 体のロボット同士で学習を開始させようとすると,お互いに初期状態であるタスクについての何も知識がない状態だと,学習過程の不安定化が見られる.現在はこれに対応するために逆強化学習やディープラーニングの技術を適用した(オ)などが適用され始めている.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
活性化関数とは,ニューロンの出力に何らかの非線形な変数を加える関数である.単純パーセプトロンの出力層では(ア)が用いられ,ニューラルネットワークの中間層では,はじめ(イ)などの正規化の機能を持つ関数が好まれた.しかし現在では,誤差逆伝播で勾配が消失しやすいという問題から,中間層では勾配消失問題の影響を抑えられ,かつ簡単な(ウ)などが用いられている.また,出力層では出力の総和が 1 になるため確率的な解釈が可能になる(エ)がよく用いられる.
次の(ア),(イ),(ウ)の組み合わせとして,適切な選択肢を 1 つ選べ.
人間の脳における学習の枠組みに基づいた三つの学習が機械学習には存在する.一つ目は小脳の働きを模倣した(ア)である.これは学習者に対して,教師が間違いを指摘し,学習者が正しい解を得ることである.二つ 目は大脳皮質の働きを模倣した(イ)である.代表的な手法として主成分分析(PCA)などの次元圧縮手法がある.三つ目は大脳基底核の働きを模倣した(ウ)である.学習者は正解値でなく,行動した結果に基づいた報酬が与えられる.この報酬をなるべく大きくするように学習者が行動していく.
(解説あり)ディープラーニングの利活用は各産業で進められているが,それが実際にディープラーニングによるブレイクスルーによってもたらされたものであるのかどうかの認識が曖昧な場合も少なくない.
選択肢のうち,ディープラーニングの産業への利活用事例として適切でないものを 1 つ選べ.
(カ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングを含めて機械学習において精度の高い学習をするためには,観測データの適切な前処理が必須である.異なるスケールの特徴量を同時に扱えるようにするために,平均を 0 に分散を 1 に規格化する(ア)や,特徴量の線形結合からデータ内の分散が大きくなるような特徴量を得る(イ)などは広く利用されている.また,画像処理の分野においては,減算正規化と除算正規化の処理を行う(ウ)などが前処理として利用され,(エ)などの画像処理に特化したライブラリで行うことができる.また,自然言語処理の分野においては,文章に単語が含まれているかどうかを考えてテキストデータを数値化する(オ)や文章に含まれる単語の重要度を特徴量とする(カ)などがある.
(解説あり)(ア)に最もよくあてはまる選択肢を 1 つ選べ.
機械学習の分野において有名な二つの定理について扱う.(ア)は,認知できる全ての客観的な特徴に基づくと全ての対象は同程度に類似している,つまり特徴を選択しなければ表現の類似度に基づく分類は不可能であることを示している.(イ)は,全てのタスクに対して常に他よりすぐれている万能的なアルゴリズムは存在しないことを示している.
(解説あり)(イ)に最もよくあてはまる選択肢を 1 つ選べ.
機械学習においては過学習を避けるために,訓練誤差ではなく汎化誤差を可能なかぎり小さくする手法である(ア)を用いることが多い.また複数のモデルの予測結果の平均を利用する(イ)がある.他にもディープニューラルネットワーク(DNN)に対しては,ランダムに一定の割合のノードを削除して学習を行う(ウ)が有効とされている.(ア)手法にはいくつかのパラメータをスパースにする(エ)などがある.
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングを含めて機械学習において精度の高い学習をするためには,観測データの適切な前処理が必須である.異なるスケールの特徴量を同時に扱えるようにするために,平均を 0 に分散を 1 に規格化する(ア)や,特徴量の線形結合からデータ内の分散が大きくなるような特徴量を得る(イ)などは広く利用されている.また,画像処理の分野においては,減算正規化と除算正規化の処理を行う(ウ)などが前処理として利用され,(エ)などの画像処理に特化したライブラリで行うことができる.また,自然言語処理の分野においては,文章に単語が含まれているかどうかを考えてテキストデータを数値化する(オ)や文章に含まれる単語の重要度を特徴量とする(カ)などがある.