テクノロジ系データベース
データマイニング(Data Mining)とは?
読み方: でーたまいにんぐ
1行定義
大量データから統計・機械学習を用いて人間が気づきにくいパターン・相関・法則を自動発見する分析技術
詳細解説
データマイニングとは、大規模なデータベースや蓄積されたデータから、統計解析・機械学習・パターン認識などの手法を用いて、人間が直感では気づきにくい隠れたパターン・相関関係・法則・傾向を自動的に発見する分析技術です。有名な例として「バスケット分析(マーケットバスケット分析)」があり、「おむつを買った顧客はビールも買う傾向がある」といった商品の購買パターンを大量の購買データから発見します。その他の主な手法として、顧客をグループに分類する「クラスタリング」、過去データから将来値を予測する「回帰分析」、二値判定を行う「決定木・ランダムフォレスト」などがあります。データマイニングはデータウェアハウスやBIシステムと組み合わせて活用されます。IT試験では「データマイニングの目的(パターン発見)」「バスケット分析・クラスタリングの例」「BIとDWHとの連携」が頻出です。
ITパスポートでの出題ポイント
- 1大量データから隠れたパターン・相関を自動発見する技術
- 2バスケット分析(アソシエーション分析)の具体例
- 3クラスタリング・回帰分析・決定木などの主な手法
- 4DWH・BIと組み合わせた活用シナリオ
関連用語
シラバス 6.5 準拠 / 最終更新: 2026-05-26