基本情報 令和6年度 科目A 問19:テクノロジ系に関する問題
図は,製品の製造上のある要因の値x と品質特性の値y との関係をプロットしたも のである。この図から読み取れることはどれか。 0 x y
- ax からy を推定するためには,2 次回帰係数の計算が必要である。
- bx からy を推定するための回帰式は,y からx を推定する回帰式と同じである。
- cx とy の相関係数は正である。
- dx とy の相関係数は負である。正答
AI解説(初心者・標準・上級)
理解度に合わせて3レベルの解説を無料で読めます。
答えは d「相関係数は負」 です。
相関係数とは「2つの値の関係性の強さ」を表す数字で、-1から+1の間。xが増えるとyも増える=正の相関、xが増えるとyが減る=負の相関。
図がxが大きくなるとyが小さくなる(右下がり)形なので、負の相関。例えば「気温が上がると暖房代が下がる」みたいな関係。
👉 覚え方:右上がり=正、右下がり=負。
ほかの選択肢:a 直線的なら1次回帰でOK/b xからyとyからxの回帰式は普通異なる(縦/横どちらの誤差を最小化するか違うため)/c 正の相関は右上がり。
なぜこれが正解か
正解は d。図の散布図がxの増加に伴いyが減少する右下がりの傾向を示すため、相関係数(ピアソン)は負(-1 < r < 0)となる。
各選択肢の解説
- a 2次回帰係数の計算が必要 → 直線的傾向なら1次回帰で十分。曲線的傾向なら2次回帰が必要だが、本図は直線的。
- b xからy推定の回帰式とyからx推定の回帰式は同じ → 誤り。最小二乗法は誤差を最小化する方向が異なるため2式は一般に一致しない(両式は重心を通り、その積=相関係数の2乗となる)。
- c 相関係数は正 → 右上がりの場合。本図は右下がりなので誤り。
- d 相関係数は負 → 正解。
覚え方・ひっかけ注意
散布図→相関の符号: 右上がり=正、右下がり=負、ばらつき大=0。回帰式が説明変数の入替で対称ではない点は応用情報・データサイエンス分野で頻出のひっかけ。相関係数=0でも非線形関係はありうる(例: 円形分布)。
理論的背景
ピアソンの積率相関係数 r = Cov(x,y)/(σx·σy) は線形相関の強度を-1≦r≦+1で測る。最小二乗法による単回帰直線は2本存在し、(1)y=ax+b はy方向残差二乗和最小化、(2)x=cy+d はx方向残差二乗和最小化。a·c = r² の関係があり、|r|<1なら2直線は重心(x̄,ȳ)で交差するが傾きは一致しない(主軸回帰=全方位最小二乗とも別物)。
実務での使われ方
品質管理QC七つ道具のうち散布図は要因解析の必須ツール。SPC(Statistical Process Control)で工程パラメータxと品質特性yの相関を測り、|r|≥0.7なら強相関として工程改善ターゲットとする。ただし相関≠因果で、交絡因子・選択バイアス・シンプソンのパラドックスに注意。ノンパラメトリック相関(スピアマンρ・ケンドールτ)は外れ値耐性が高く順位データ向け。機械学習では多重共線性(VIF>10)検出やSHAP値・偏依存プロットなど多変量解析手法で発展。
試験での位置づけ
FE科目Aでは散布図読解・回帰分析・QC七つ道具(ヒストグラム・散布図・特性要因図・パレート図・チェックシート・管理図・層別)が頻出。応用情報・データベース・データサイエンティスト系では、決定係数R²・調整済みR²・最小二乗法の幾何学的解釈・正則化(Ridge/Lasso/ElasticNet)・主成分分析(PCA)・t検定・分散分析(ANOVA)まで広がる。近年は新QC七つ道具(親和図・連関図・系統図・マトリクス図・アローダイアグラム・PDPC・マトリクスデータ解析)とのブレンド出題も。
選択肢の発展補足
bの「逆回帰の式が同じ」は受験者が直感的に正と誤判定しやすい有名なひっかけ。両直線が一致するのは|r|=1(完全線形)の場合のみ。aの2次回帰必要性判定は、残差プロット(Residual Plot)で系統的パターン(U字・S字)があるかで判断する実務的アプローチが正攻法。cとdの符号判定は、共分散Σ(xi-x̄)(yi-ȳ)の符号で機械的に判別可能。
出典:IPA(情報処理推進機構)公式 基本情報技術者試験 令和6年度 科目A 問19/ 公的機関配布資料につき出典明記の上引用。解説は合格ナビによる独自AI解説です。