第8問
意思決定や計画立案のために、データを収集して加工・分析することがますます 重要になってきている。以下の文章の空欄A~Dに入る語句の組み合わせとして、 最も適切なものを下記の解答群から選べ。 意思決定や計画立案のために、組織内で運用される情報システムやデータベース などからデータを集めて格納しておく場所を A と呼ぶ。この A か ら、必要なものだけを利用しやすい形式で格納したデータベースを B と呼ぶ。 このような構造化されたデータに加えて、IoT 機器やSNS などからの構造化さ れていないデータを、そのままの形式で格納しておく C が利用されつつあ る。膨大なデータを蓄積する必要があるため、比較的安価なパブリッククラウドの オブジェクトストレージに格納される場合が多い。 収集されたデータの品質を高めるためには、データ形式の標準化や D が 重要である。
- ア A:データウェアハウス B:データマート C:データレイク D:データクレンジング
- イ A:データウェアハウス B:データレイク C:データスワンプ D:データクレンジング
- ウ A:データマート B:データウェアハウス C:データプール D:データマイグレーション
- エ A:データマート B:リレーショナルデータベース C:データレイク D:データマイグレーション
- オ A:データレイク B:データマート C:データプール D:データマイニング
▼ 解答・解説を見る
正解:ア
解答:ア
データ分析基盤の用語を整理する問題。元データを集約する大容量の格納先がデータウェアハウス、そこから用途別に切り出した小規模DBがデータマート、非構造化データを生のまま貯めるのがデータレイク。
- A=データウェアハウス:組織内の各システムからデータを集めて格納する場所。
- B=データマート:データウェアハウスから必要なものだけを利用しやすい形式で格納した小規模DB。
- C=データレイク:構造化・非構造化データを変換せずそのままの形式で蓄積する場所。安価なオブジェクトストレージに格納されることが多い。
- D=データクレンジング:データの誤り・重複・表記揺れを補正し品質を高める処理。
- ア(○):データウェアハウス/データマート/データレイク/データクレンジングの組合せがすべて適合。
- イ(×):Bをデータレイク、Cをデータスワンプ(管理不全で劣化したデータレイクの俗称)とする点が不適。
- ウ(×):AとBが逆で、Dのデータマイグレーション(データ移行)は品質向上策ではない。
- エ(×):Aがデータマートで不適、Dもデータマイグレーションで不適。
- オ(×):Aがデータレイク、Dのデータマイニング(知見抽出)は品質向上策ではなく不適。
よって ア。