データウェアハウスとは
データウェアハウス(Data Warehouse: DWH)とは、企業内の複数のソースシステムからデータを収集・統合し、分析や意思決定に活用するために設計された大規模なデータ格納システムです。ビル・インモンが1990年代に提唱した概念で、ビジネスインテリジェンスの基盤となります。
データウェアハウスの特徴
DWHは主題指向(特定のビジネステーマ別にデータを整理)、統合性(複数ソースのデータを統一的なフォーマットで格納)、時系列性(時間軸に沿ったデータの履歴を保持)、非揮発性(一度格納されたデータは更新・削除されず蓄積される)の4つの特徴を持ちます。
DWHのアーキテクチャ
DWHのアーキテクチャには、キンボール方式(ディメンショナルモデリング、スター/スノーフレークスキーマ)とインモン方式(正規化されたエンタープライズDWH)があります。クラウドDWH(BigQuery、Snowflake、Redshift)の登場により、構築・運用の柔軟性が大幅に向上しています。
データウェアハウスの役割
DWHはBI(ビジネスインテリジェンス)ツールやダッシュボードと連携し、経営レポート、パフォーマンス分析、トレンド分析などを支援します。データマートやデータレイクと組み合わせた現代的なデータアーキテクチャの中核として機能しています。