G検定模擬試験set1 - 未解答
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
線形モデルとは,(ア)を含む項の線形結合で,(ア)を含んだ数式の出力値は(イ)と呼ばれる.この線形結合で,特に(ア)も(イ)も一次元のデータの場合は,y = b0 + b1 * x と表される.こういったモデルを単回帰モデルと呼んだりもする.この数式において,各項の係数(例えば b0, b1)を(ウ)と呼び,このモデルを用いてテストデータを学習し,測定した実データを推定する.注意点として,(イ)が連続の値を取り扱う場合(エ)と呼ばれるが,離散の値を取り扱われる場合は(オ)と呼ばれ,それぞれ名称が異なる.ただ,実際のデータを扱うときに,(ア)が 1 次元であることはほとんどなく,2 次元以上になることが一般的である.このような場合,(ア)の次元数分だけ,係数パラメータを増やして,モデルを拡張する必要がある.このように(ア)が 2 つ以上の場合を(カ)モデルと呼び,各項の係数パラメータを(キ)という.またモデルによって出力された値と実際の測定値の誤差を(ク)という.この(ク)を用いて係数パラメータを推定する代表的なアルゴリズムに最小二乗法と最尤推定法がある.
(解説あり)(ア)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングでの学習を効率的に行うにあたって,共有データセットの整備が徐々に進められている.しかしながら,現在広く普及しているものには,いくつかの問題点が指摘されている. 第一は, (ア) の問題である.現在は公正な利用がなされているとされているが,企業が共有データセットを利用して学習したモデルを自社のプロダクトに転用して売り上げを上げようとした場合に問題はないのかという議論が巻き起こっている.他の問題として,これは日本にとっての問題であるが,多くのデータセットが (イ) であることが挙げられる.これにより,日本固有の食べ物を認識しようとすると,それが全く別の国の食べ物としてのみ認識されるという不具合が生じるに至っている.
(エ)に最もよくあてはまる選択肢を 1 つ選べ.
画像生成とは,何もない状態,もしくはある入力値に応じて目標の画像を生成する技術である.今最も利用されている画像生成手法は,GAN という生成敵対ネットワークである.特に,あるランダムな数値の入力値をもとに画像生成を行う DC(ア)やある文章から画像を生成する Attention(ア)などが有名である.このネットワークは(イ)と(ウ)から構成されており,(イ)は(エ)を騙すような画像を出力し,(ウ)は(イ)から出力された画像と本物の画像とを分類するようにそれぞれ学習する.このように学習することで,(イ)は適切な画像を出力することが可能となる.
(解説あり)(ア)に最もよくあてはまる選択肢を 1 つ選べ.
AI が実世界における抽象概念を理解し,知識処理を行う上では,(ア) を通じた高レベルの身体知を獲得し,次に (イ)を通じて言語の意味理解を促し,抽象概念・知識処理へと至るのではないかということが議論されている.
(イ)に最もよくあてはまる選択肢を 1 つ選べ.
線形モデルとは,(ア)を含む項の線形結合で,(ア)を含んだ数式の出力値は(イ)と呼ばれる.この線形結合で,特に(ア)も(イ)も一次元のデータの場合は,y = b0 + b1 * x と表される.こういったモデルを単回帰モデルと呼んだりもする.この数式において,各項の係数(例えば b0, b1)を(ウ)と呼び,このモデルを用いてテストデータを学習し,測定した実データを推定する.注意点として,(イ)が連続の値を取り扱う場合(エ)と呼ばれるが,離散の値を取り扱われる場合は(オ)と呼ばれ,それぞれ名称が異なる.ただ,実際のデータを扱うときに,(ア)が 1 次元であることはほとんどなく,2 次元以上になることが一般的である.このような場合,(ア)の次元数分だけ,係数パラメータを増やして,モデルを拡張する必要がある.このように(ア)が 2 つ以上の場合を(カ)モデルと呼び,各項の係数パラメータを(キ)という.またモデルによって出力された値と実際の測定値の誤差を(ク)という.この(ク)を用いて係数パラメータを推定する代表的なアルゴリズムに最小二乗法と最尤推定法がある.
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
現在の教師あり学習は,与えられたデータがどの分類に当てはまるのかを識別する(ア)と,様々な関連性のある過去の数値から未知の数値を予測する(イ)という二つに分類される.(ア)を用いることで,(ウ)のようなことができる.また(イ)を用いることで,(エ)のようなことができる.
(ウ)に最もよくあてはまる選択肢を 1 つ選べ.
画像の認識では,主に入力から出力に向かう結合のみを持つ階層的なニューラルネットワーク,特に画像などの信号に内在する局所的な特徴が集まって,より大域的な特徴を構成するという構造を反映した,(ア)がよく用いられる.一方,自然言語テキストや動画に代表される構造を持った系列情報を扱うために(イ)が用いられている.特に現代人工知能(AI)の父として知られているユルゲン・シュミットフーバーとケプラー大学のゼップ・ホフレイターの提案した(ウ)は必要な文脈情報の長さを適応的に制御することで,時間を遡る誤差逆伝播の可能性を向上させ,画像からの説明文の生成や機械翻訳など,多くの課題に適用されている.実際,2016 年秋に,google 社は google 翻訳に(ウ)を取り入れてアップデートし,非常に高精度な翻訳を提供することが可能になった.
(オ)に最もよくあてはまる選択肢を 1 つ選べ.
線形モデルとは,(ア)を含む項の線形結合で,(ア)を含んだ数式の出力値は(イ)と呼ばれる.この線形結合で,特に(ア)も(イ)も一次元のデータの場合は,y = b0 + b1 * x と表される.こういったモデルを単回帰モデルと呼んだりもする.この数式において,各項の係数(例えば b0, b1)を(ウ)と呼び,このモデルを用いてテストデータを学習し,測定した実データを推定する.注意点として,(イ)が連続の値を取り扱う場合(エ)と呼ばれるが,離散の値を取り扱われる場合は(オ)と呼ばれ,それぞれ名称が異なる.ただ,実際のデータを扱うときに,(ア)が 1 次元であることはほとんどなく,2 次元以上になることが一般的である.このような場合,(ア)の次元数分だけ,係数パラメータを増やして,モデルを拡張する必要がある.このように(ア)が 2 つ以上の場合を(カ)モデルと呼び,各項の係数パラメータを(キ)という.またモデルによって出力された値と実際の測定値の誤差を(ク)という.この(ク)を用いて係数パラメータを推定する代表的なアルゴリズムに最小二乗法と最尤推定法がある.
(解説あり)ディープラーニングの利活用は各産業で進められているが,それが実際にディープラーニングによるブレイクスルーによってもたらされたものであるのかどうかの認識が曖昧な場合も少なくない.
選択肢のうち,ディープラーニングの産業への利活用事例として適切でないものを 1 つ選べ.
(ア)に最もよくあてはまる選択肢を 1 つ選べ.
ディープラーニングの実験に用いられるデータセットについて扱う.(ア)はアメリカの国立標準技術研究所によって提供されている手書き数字のデータベースである.また,スタンフォード大学がインターネット上から画像を集めて分類したデータセットである(イ)は,約 1400 万枚の自然画像を有しており,画像認識の様々なタスクに利用される.
loading!!