概要
Big Query 差分プライバシーのパブリックプレビューがリリース。
将来的には、今回の差分プライバシーソリューションをBigQuery データ クリーン ルームと統合し、プライバシーを保護しながら組織が機密データを匿名化して共有できるようにする予定。
何がGood?
Googleがリリースしているdifferential-privacyというOSSを基盤として、Google SQL for BigQuery に差分プライバシーが追加された。
BigQuery の差分プライバシーは既存のセキュリティ制御とも連携するため、次のことが可能に。
Usage
差分プライバシーを次の集計関数に適用して、結果を匿名化できる。
- 和
- カウント
- 平均
- PERCENTILE_CONT
SELECT
WITH
DIFFERENTIAL_PRIVACY
OPTIONS (
epsilon = 1,
delta = 1e-7,
privacy_unit_column = npi)
provider_type,
PERCENTILE_CONT(
bene_unique_cnt, 0.5, contribution_bounds_per_row => (0, 10000))
percentile_50th,
PERCENTILE_CONT(
bene_unique_cnt, 0.9, contribution_bounds_per_row => (0, 10000))
percentile_90th
FROM `bigquery-public-data.cms_medicare.physicians_and_other_supplier_2015`
WHERE provider_type IS NOT NULL
GROUP BY 1
ORDER BY 2 DESC
LIMIT 10;
-- Query results may differ slightly with each run due to noise being applied
/*--------------------------------------+-----------------+-----------------*
| provider_type | percentile_50th | percentile_90th |
+--------------------------------------+-----------------+-----------------+
| Peripheral Vascular Disease | 132.95 | 3134.24 |
| Ambulance Service Supplier | 101.81 | 697.79 |
| Multispecialty Clinic/Group Practice | 75.03 | 2316.40 |
| Addiction Medicine | 68.38 | 3811.18 |
| Public Health Welfare Agency | 67.27 | 597.46 |
| Neuropsychiatry | 63.85 | 375.88 |
| Emergency Medicine | 62.86 | 272.00 |
| Centralized Flu | 52.97 | 216.98 |
| Clinical Laboratory | 52.04 | 744.01 |
| Ophthalmology | 49.93 | 282.12 |
*--------------------------------------+-----------------+-----------------*/
Introducing BigQuery differential privacy
概要
Big Query 差分プライバシーのパブリックプレビューがリリース。
将来的には、今回の差分プライバシーソリューションをBigQuery データ クリーン ルームと統合し、プライバシーを保護しながら組織が機密データを匿名化して共有できるようにする予定。
何がGood?
Googleがリリースしているdifferential-privacyというOSSを基盤として、Google SQL for BigQuery に差分プライバシーが追加された。
BigQuery の差分プライバシーは既存のセキュリティ制御とも連携するため、次のことが可能に。
Usage
差分プライバシーを次の集計関数に適用して、結果を匿名化できる。