🏠 総合トップ 中小企業診断士1次試験 用語集 経営情報システム
最新技術・経営情報管理

ビッグデータ

Big Data

概要

従来の技術では処理困難な大量・多種・高速なデータの集合とその活用技術。

詳細解説

ビッグデータは、Volume(量)、Variety(多様性)、Velocity(速度)の3V(場合により5V)で特徴づけられる大規模データの集合とその処理・活用技術を指す。従来のRDBMSでは処理が困難なほどの規模や多様性を持つ。

Hadoopは大規模データを複数のサーバに分散して処理するオープンソースのフレームワークである。Apache Sparkはリアルタイムに近い高速処理が可能である。ビッグデータの活用にはデータサイエンティストの役割が重要である。

試験対策のポイント

  • 暗記必須:ビッグデータは従来技術で処理困難な大量・多種・高速のデータ。特徴の3V=Volume(量)・Variety(多様性)・Velocity(速度)。
  • 頻出ポイント:データの種類=構造化データ(表形式)、半構造化データ、非構造化データ(テキスト・画像・動画)。非構造化データの活用が課題。
  • 関連づけ:データレイクに蓄積し、AI・データマイニングで分析する。IoTがデータ源として結びつく。

事例・具体例

コンビニのPOSデータ、SNSの投稿、Webのアクセスログ、GPSの位置情報、気象データなど、多種多様なデータを組み合わせて分析し、マーケティングや需要予測に活用する。