データクリーンルームとは
データクリーンルームとは、複数の組織がそれぞれのデータを安全な環境に持ち寄り、プライバシーを保護しながら共同分析を行うための技術的・制度的な仕組みのことです。参加者はデータの生データを直接閲覧することはできず、承認された分析クエリの結果のみを取得できます。サードパーティCookieの廃止を受けて、広告・マーケティング分野で急速に普及しています。
データクリーンルームの仕組み
データクリーンルームでは、各参加者が暗号化されたデータをクリーンルーム環境にアップロードします。分析クエリは事前に定義されたルールに基づいてのみ実行可能で、個人を特定できる結果の出力は防止されます。匿名化、差分プライバシー、セキュアマルチパーティ計算などの技術が組み合わせて使用されます。代表的なサービスとして、Google Ads Data Hub、Amazon Marketing Cloud、Snowflake Data Clean Roomなどがあります。
AI開発での活用
AI開発においてもデータクリーンルームの活用が広がっています。複数の医療機関の患者データを用いた疾病予測モデルの構築や、複数の金融機関の取引データを用いた不正検知モデルの開発など、単独の組織ではアクセスできないデータを活用したAI開発が可能になります。ガバナンスの観点では、データクリーンルームのセキュリティ基準、許可される分析の範囲、結果の利用条件、監査の仕組みなどを参加者間で合意することが重要です。