経営情報システム R04年度 第4問

第4問

データを格納する考え方としてデータレイクが注目されている。データレイクに 関する記述として、最も適切なものはどれか。

  1. 組織内で運用される複数のリレーショナルデータベースからデータを集めて格 納する。
  2. 組織内の構造化されたデータや、IoT 機器やSNS などからの構造化されてい ないデータをそのままの形式で格納する。
  3. データウェアハウスから特定の用途に必要なデータを抽出し、キー・バリュー 型の形式で格納する。
  4. データ利用や分析に適したスキーマをあらかじめ定義して、その形式にした がってデータを格納する。
  5. テキスト形式のデータと画像・音声・動画などのバイナリ形式のデータをそれ ぞれ加工し、構造化したうえで格納する。
▼ 解答・解説を見る

正解:

解答:イ

データレイクとは、構造化・非構造化を問わずあらゆる形式の生データを、加工せず元の形式のまま大量に蓄積するデータの保管庫である。利用時にスキーマを定義する「スキーマ・オン・リード」が特徴。

  • ア(×):複数RDBからデータを集約・整形して格納するのはデータウェアハウス(DWH)の説明に近い。レイクは構造化データに限定しない。
  • イ(○):構造化データもIoT/SNS等の非構造化データも、そのままの形式で格納する。データレイクの定義そのもの。
  • ウ(×):DWHから特定用途分を抽出するのはデータマートの説明。キー・バリュー型に限定されもしない。
  • エ(×):あらかじめスキーマを定義して格納するのはDWH(スキーマ・オン・ライト)の特徴。レイクは利用時にスキーマを与える。
  • オ(×):加工・構造化してから格納するという点がレイクの「生のまま蓄積」と矛盾する。

よって

#経営情報・IT戦略

← 経営情報システムの一覧へ戻る