令和6年度問65テクノロジ系

ITパスポート令和6年度問65：aiに関する問題

AI における機械学習の学習方法に関する次の記述中の a〜c に入れる字句の適切な組合せはどれか。教師あり学習は、正解を付けた学習データを入力することによって、a と呼ばれる手法で未知のデータを複数のクラスに分けたり、b と呼ばれる手法でデータの関係性を見つけたりすることができるようになる学習方法である。教師なし学習は、正解を付けない学習データを入力することによって、c と呼ばれる手法などで次第にデータを正しくグループ分けできるようになる学習方法である。選択肢: ア a=回帰 b=分類 c=クラスタリング / イ a=クラスタリング b=分類 c=回帰 / ウ a=分類 b=回帰 c=クラスタリング / エ a=分類 b=クラスタリング c=回帰

aa=回帰, b=分類, c=クラスタリング
ba=クラスタリング, b=分類, c=回帰
ca=分類, b=回帰, c=クラスタリング正答
da=分類, b=クラスタリング, c=回帰

正答：Ca=分類, b=回帰, c=クラスタリング

AI解説（初心者・標準・上級）

理解度に合わせて3レベルの解説を無料で読めます。

初心者向けまずはここから。やさしく要点を解説

答えは c（a=分類、b=回帰、c=クラスタリング） です。

AIの学習には「お手本あり」と「お手本なし」の2タイプがあります。

お手本あり（教師あり学習）では、(a) 分類＝「これは犬、これは猫」と仲間分けする、(b) 回帰＝「気温が上がると売上はいくら？」のように数字の関係を予想する、の2つができます。

お手本なし（教師なし学習）では、(c) クラスタリング＝答えを教えなくても「なんか似てる者同士」を勝手にグループ分けします。

👉 覚え方：分類＝仕分け／回帰＝数の予想／クラスタリング＝勝手に仲間集め。

ほかの選択肢はa・b・cの組み合わせが入れ替わっていて当てはまりません。

標準試験対策の基準レベル

なぜこれが正解か

正解は c。

a＝分類：正解ラベル付きデータで学習し、未知データをあらかじめ決めた複数のクラス（カテゴリ）に振り分ける手法。
b＝回帰：同じく正解付きデータから、入力と出力（連続値）の関係性を見つけ数値を予測する手法。
c＝クラスタリング：正解ラベルなしのデータを、性質の近さで自動的にグループ分けする教師なし学習の代表手法。

よって a=分類／b=回帰／c=クラスタリングとなる。

各選択肢の検証

回帰・分類は「正解あり＝教師あり学習」、クラスタリングは「正解なし＝教師なし学習」に属する。ア・イ・エはこの対応が崩れているため誤り。

覚え方・ひっかけ注意

クラスタリング＝教師なしを軸に覚えると速い。文中の c は「正解を付けない学習データ」と明記されるので、ここに入るのはクラスタリング一択。分類（クラス分け）と回帰（数値予測）が教師あり側、と対で整理。

上級誤答論破・背景理論まで深掘り

理論的背景

機械学習の学習パラダイムは正解ラベルの有無によって大別される。教師あり学習（Supervised Learning）は入力と対応する正解ラベルのペアでモデルを訓練し、未知データへの予測能力を獲得する。本問のキーとなる「分類（Classification）」はラベルが離散値（カテゴリ）であり、サポートベクターマシン・ランダムフォレスト・ニューラルネットワークなどが代表的アルゴリズム。「回帰（Regression）」はラベルが連続値であり、入出力の関係性（相関・因果の近似）を数式で表現する。一方、教師なし学習（Unsupervised Learning）は正解ラベルなしでデータの内部構造を発見する。「クラスタリング（Clustering）」はデータ点間の類似度に基づいてグループを自動形成する手法で、k-means法・階層クラスタリング・DBSCAN等が代表例。本問では「分類=教師あり・クラスタリング=教師なし」という対応関係が核心。

実務での使われ方

3手法は現場で明確に使い分けられる。分類の実例：スパムフィルタ（スパム/正常）・医療画像診断（疾患あり/なし）・与信判断（貸倒リスク高/低）。回帰の実例：不動産価格予測・売上予測・機器の残余寿命予測（RUL: Remaining Useful Life）。クラスタリングの実例：顧客セグメンテーション（購買行動による顧客グループ化）・異常検知（通常クラスタから外れた点を異常と判定）・文書カテゴリ自動分類（トピックモデリング）。近年の生成AI（LLM）の台頭により「ファインチューニング（教師あり学習の一形態）」と「プロンプトエンジニアリング（Few-shot学習）」の理解も実務者には必須となっている。MLOps（機械学習の運用管理）の観点では、モデルのドリフト検知にも教師なし学習（分布変化の検出）が活用されている。

試験での位置づけ

AI・機械学習分野は近年のITパスポートで出題数が増加しており、本問のように3用語の組み合わせ（a〜c の適切な組合せはどれか）形式で正確な対応関係を問う問題が頻出。「教師あり→分類・回帰」「教師なし→クラスタリング・次元削減」という対応が最重要知識。紛らわしいのは「分類とクラスタリングはどちらもグループ分けに見える」点であり、正解ラベルの有無という本質的違いを理解していないと本問のように選択肢dや選択肢aを選んでしまう。基本情報技術者（FE）ではさらに強化学習（Reinforcement Learning）の報酬最大化メカニズム、過学習・汎化性能、交差検証（k-fold CV）まで問われる。応用情報・高度試験では特定アルゴリズムの数式レベルの理解が求められるケースもある。

選択肢の発展補足

選択肢aの「a=回帰、b=分類」は教師あり学習の2手法の順序が逆。問題文が「複数のクラスに分ける＝分類、データの関係性を見つける＝回帰」と明確に定義しているため、「クラス（離散カテゴリ）に分ける→分類」「連続的な関係性（数値の傾向）を見つける→回帰」と読み解くのが確実。選択肢bはクラスタリングを教師あり学習に誤分類しており、選択肢dは回帰を教師なし学習に誤分類している。発展知識として、「半教師あり学習（Semi-supervised Learning）」は少数の正解ラベル＋多数のラベルなしデータを組み合わせ、医療・製造など正解ラベルのコストが高い分野で有効。また「自己教師あり学習（Self-supervised Learning）」はLLMやVision Transformerの学習基盤となっており、これらも広義の教師あり学習の進化形として押さえておきたい。

出典・引用について

出典：IPA（情報処理推進機構）公式 ITパスポート試験令和6年度問65／公的機関配布資料につき出典明記の上引用。解説は合格ナビによる独自AI解説です。