データベース
データマイニング
Data Mining
概要
大量のデータから統計的手法やAIを用いて、有用なパターンや知識を発見する技術。
詳細解説
データマイニングは、大量のデータの中から、統計学、機械学習、パターン認識などの手法を用いて、人間が気づかない有用なパターン、相関関係、傾向を発見する技術である。
代表的な手法として、クラスタ分析(データのグループ化)、アソシエーション分析(関連性の発見)、決定木分析(分類ルールの抽出)、回帰分析(予測モデルの構築)などがある。BI(ビジネスインテリジェンス)の中核技術である。
試験対策のポイント
- 暗記必須:データマイニングは大量データから統計・AIの手法で隠れたパターンや法則を発見する技術。
- 頻出ポイント:代表手法=アソシエーション分析(バスケット分析、併売関係。「おむつとビール」が有名)、クラスタリング、決定木、回帰分析など。
- 関連づけ:アソシエーション分析では支持度・確信度(信頼度)・リフト値という指標が問われる。DWHやビッグデータ活用の文脈で出題される。
事例・具体例
スーパーマーケットでの「おむつとビールが一緒に購入される」という発見はアソシエーション分析の有名な事例である。顧客の購買パターン分析やクレジットカードの不正検知に活用される。