令和5年度76テクノロジ系

ITパスポート 令和5年度 問76:aiに関する問題

品質管理担当者が行っている検査を自動化することを考えた。10,000枚の製品画像と,それに対する品質管理担当者による不良品かどうかの判定結果を学習データとして与えることによって,製品が不良品かどうかを判定する機械学習モデルを構築した。100枚の製品画像に対してテストを行った結果は表のとおりである。品質管理担当者が不良品と判定した製品画像数に占める,機械学習モデルの判定が不良品と判定した製品画像数の割合を再現率としたとき,このテストにおける再現率は幾らか。[表] 機械学習モデルによる判定(不良品/良品): 品質管理担当者→不良品: 5/5, 品質管理担当者→良品: 15/75 (単位: 枚)

  • a0.05
  • b0.25
  • c0.50正答
  • d0.80
正答:C0.50

AI解説(初心者・標準・上級)

理解度に合わせて3レベルの解説を無料で読めます。

初心者向けまずはここから。やさしく要点を解説

答えは c(0.50) です。

「再現率」は、“本当の不良品を、どれだけ取りこぼさず見つけられたか”の割合です。

本当に不良品だったのは10枚(担当者が不良品と判定した数)。そのうちAIも「不良品」と正しく当てたのは5枚。だから 5÷10=0.5(半分)です。

👉 覚え方:「再現率=本物のうち、ちゃんと見つけられた割合」。

ヒント:表の「担当者→不良品」の行(5+5=10枚)が“本当の不良品”の合計。その中でAIが当てた5枚を分子にします。

標準試験対策の基準レベル

なぜこれが正解か

正解は c(0.50)。再現率(Recall)は「実際に不良品であるもののうち、モデルが正しく不良品と判定できた割合」。

表より、品質管理担当者が不良品と判定したのは合計10枚(モデル不良品判定5+モデル良品判定5)。このうちモデルも不良品と判定したのは5枚。

再現率 = 5 ÷ (5+5) = 5 ÷ 10 = 0.50

各選択肢の解説

  • a 0.05:分母を全100枚にした誤り。
  • b 0.25:計算根拠のない値。
  • d 0.80:適合率や正解率と取り違えた誤り。

覚え方・ひっかけ注意

再現率の分母は「実際に不良品だった数(担当者基準の行)」。適合率(Precision)の分母は「モデルが不良品と判定した数(列)」。「分母を“正解側で割る”のが再現率」と覚えると取り違えを防げる。

上級誤答論破・背景理論まで深掘り

理論的背景

再現率(Recall)の理論的根拠は混同行列(Confusion Matrix)にある。二値分類において予測と正解の組み合わせは4通り:真陽性(TP: 実際も不良・予測も不良)・偽陰性(FN: 実際は不良・予測は良品=見逃し)・偽陽性(FP: 実際は良品・予測は不良=誤検知)・真陰性(TN: 実際も良品・予測も良品)である。本問ではTP=5、FN=5、FP=15、TN=75となる。各評価指標を整理すると、再現率=TP/(TP+FN)=5/10=0.50、適合率(Precision)=TP/(TP+FP)=5/20=0.25、正解率(Accuracy)=(TP+TN)/全件=80/100=0.80となる。4選択肢(0.05・0.25・0.50・0.80)は意図的にこれら異なる指標の正答値として設計されており、「どの指標を計算しているか」の理解を問う典型的な設問構造である。F1スコアは再現率と適合率の調和平均であり、F1 = 2×(Precision×Recall)/(Precision+Recall) = 2×(0.25×0.50)/(0.25+0.50) ≈ 0.33 となる。

実務での使われ方

指標の選択は「何を最優先に最小化したいか」によって決まる。製造業の不良品検査では見逃し(FN)が後工程でのコスト・リコールリスクに直結するため、再現率を最大化する設計が選ばれる。これとは逆に、検索エンジンの推薦システムや医療スクリーニングの一次判定では「推薦・陽性判定したものが確かにそうである」適合率を重視するケースがある。金融の不正取引検知では、見逃し(FN)は不正被害の拡大、過検知(FP)は正常ユーザーの利便性低下を招くため、閾値を調整してF1スコアや業務コストに基づく独自の複合指標で最適化する。不均衡データ(本問のように良品95件・不良品5件)では正解率0.95の「常に良品と予測するだけ」のモデルが作れてしまう問題があり、これを「精度のパラドックス」と呼ぶ。再現率・適合率・F1はこのような不均衡データでこそ真価を発揮する指標である。

試験での位置づけ

AI・機械学習の評価指標はITパスポートの計算問題として近年急増しており、混同行列の読み方・各指標の計算・解釈が問われるパターンが確立されている。本問のように「4選択肢=4つの異なる指標の答え」という設計は、用語の暗記ではなく正確な計算と指標の使い分けを要求する良問の典型である。2023〜2025年度の試験では、再現率・適合率に加えて交差検証・ホールドアウト法・過学習の概念も出題されており、AI評価に関する出題範囲が拡大傾向にある。基本情報技術者ではROC曲線(Receiver Operating Characteristic)・AUC(Area Under the Curve)による閾値調整の評価まで踏み込んで問われる。

選択肢の発展補足

選択肢aの0.05は100件中でモデルが不良品と予測した5件の割合であり、いずれの標準的指標とも一致しない計算根拠のない値である。選択肢bの0.25は適合率(Precision)の正答値であり、モデルが不良品と予測した20件中実際に不良品だったのは5件であることを表す。この値が低い(適合率0.25)のに再現率0.50のモデルは、不良品を見逃さない代わりに多くの誤検知(FP=15件)を出している状態を意味する。選択肢dの0.80は正解率(Accuracy)の正答値だが、良品が95件と大多数を占める不均衡データにおいて高い正解率は「ほとんど良品と言っておけば当たる」ことによる見かけ上の高さであり、不良品検知の実用性を評価する指標としては不適切である。この「精度のパラドックス」の理解は、AIモデルの評価リテラシーとして実務でも試験でも問われる重要な視点である。

出典・引用について

出典:IPA(情報処理推進機構)公式 ITパスポート試験 令和5年度76/ 公的機関配布資料につき出典明記の上引用。解説は合格ナビによる独自AI解説です。

テクノロジ系の他の過去問

55
security
56
database
57
database
58
technology_element
59
network

あなたの弱点を診断して、合格までの最短ルートを

この分野を連続演習し、AIがあなたの弱点を分析。合格ナビならITパスポートの過去問を解きながら学べます。