データウェアハウス(DWH)

Data Warehouse

データウェアハウスとは

データウェアハウス(DWH: Data Warehouse)とは、企業のさまざまな業務システムからデータを収集・統合・蓄積し、分析やレポーティングに活用するための大規模データ基盤です。「データの倉庫」の名の通り、過去から現在までの大量のデータを時系列で保存し、意思決定に必要な情報を迅速に抽出できるよう設計されています。

DWHの特徴と構成要素

DWHには4つの特徴があります。①サブジェクト指向(業務別ではなくテーマ別にデータを整理)、②統合性(異なるソースのデータを統一フォーマットで格納)、③時系列性(時間軸での変化を追跡可能)、④非更新性(一度格納したデータは変更しない)。構成要素として、データソース、ETL/ELT層、ストレージ層(データレイクを含む場合もある)、分析・BIツール層があります。

クラウドDWHの主要サービス

現在はクラウドベースのDWHが主流です。Google BigQuery(サーバーレスで従量課金、高速クエリ)、Amazon Redshift(AWSエコシステムとの統合)、Snowflake(マルチクラウド対応、コンピュートとストレージの分離)が3大サービスです。オンプレミスのDWHと比較して、初期投資の削減、スケーラビリティ、運用負荷の軽減が大きなメリットです。

マーケティング分析基盤としてのDWH

マーケティング部門がDWHを活用することで、①広告・CRM・GA4等のクロスチャネルデータの統合分析、②アトリビューションモデルの構築、③顧客LTVの算出と予測、④リアルタイムダッシュボードの構築、⑤機械学習モデルへのデータ供給が可能になります。「データの民主化」を実現する分析基盤として、マーケティングのDXに不可欠なインフラです。