BÊN MUA
NA
Quay lại Sandbox & Clean Room
CR-2026-04-0082
● Hoạt động
Clean Room · SMPC + DP

Phân tích rủi ro tín dụng SME

Datasets: DV-TCKT-001 + DV-DN-042 · Hoạt động 4 giờ · 42 queries đã chạy
Cường độ bảo mật (ε) Càng nhỏ càng riêng tư. ε = 1.0 là mức bảo mật mạnh tiêu chuẩn. Hệ thống thêm nhiễu ngẫu nhiên vào kết quả query để ẩn danh cá nhân.
1.0
Bảo mật mạnh
Xác suất rò rỉ (δ) Xác suất nhỏ mà cơ chế bảo vệ có thể thất bại. δ = 1e-5 nghĩa là 1 trên 100.000 query có thể rò rỉ — đây là chuẩn công nghiệp.
1e-5
Xác suất thất bại
k-ẩn danh (k) Mỗi bản ghi trong kết quả phải ẩn trong nhóm có ít nhất k cá nhân giống nhau. k ≥ 100 nghĩa là mỗi người ẩn trong đám đông ≥100 người.
≥ 100
Kích thước nhóm tối thiểu
Hạn mức riêng tư Tổng lượng ε được phép tiêu thụ trong một session. Mỗi query tiêu một phần, khi hết hạn mức thì không chạy query được nữa.
đã dùng 68%

SQL Query Editor

Chỉ SELECT + aggregate được phép · Output tự động thêm noise

-- Phân tích phân bố điểm tín dụng SME theo ngành nghề
-- Budget dự kiến: 0.12 epsilon (sẽ còn 20% sau query này)

SELECT
  dn.industry_code,
  dn.industry_name,
  COUNT(*) AS total_sme,
  AVG(tc.credit_score) AS avg_score,
  STDDEV(tc.credit_score) AS score_stddev,
  PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY tc.credit_score) AS median_score
FROM dv_dn_042.companies dn
INNER JOIN dv_tckt_001.credit_scores tc
  ON dn.mst = tc.mst
WHERE
  dn.revenue_tier = 'SME'
  AND tc.score_date >= '2026-01-01'
GROUP BY dn.industry_code, dn.industry_name
HAVING COUNT(*) >= 100  -- k-anonymity enforcement
ORDER BY avg_score DESC
LIMIT 20;
Query sẽ tiêu tốn 0.12 ε · HAVING COUNT ≥ 100 đảm bảo k-anonymity · Kết quả sẽ thêm Laplace noise với scale = 1/ε.

Kết quả (với differential privacy noise)

18 nhóm sau k-anon
NgànhSố DNĐiểm TBStddevMedian
Công nghệ thông tin2.847742.4±84.2748
Tài chính - NH1.284718.8±92.1720
Thương mại điện tử842684.2±78.4688
Sản xuất công nghiệp3.124672.1±88.6670
Bán lẻ & phân phối4.280648.4±94.8645
Logistics & vận tải1.842634.2±82.4638
18 nhóm được trả về · Query execution: 842ms · Budget sau query: 0.32 còn lại

Lịch sử query

Mọi query đều được ghi NDAChain để audit

14:32
SELECT COUNT(*) FROM sme_credit WHERE score >= 700...
Budget tiêu thụ: 0.08 ε · k-anon: 842
14:18
SELECT AVG(score), industry FROM sme_credit GROUP BY industry
Budget tiêu thụ: 0.12 ε · k-anon: 124
13:45
SELECT score_distribution FROM sme_credit WHERE region = 'HN'
Budget tiêu thụ: 0.15 ε · k-anon: 2840
13:20
SELECT * FROM sme_credit LIMIT 100
Từ chối: Vi phạm k-anonymity (SELECT * không cho phép)

Schema

dv_tckt_001.credit_scores
mst chuỗi (đã che)
credit_score number
risk_grade enum
score_date date
industry_code string
dv_dn_042.companies
mst chuỗi (đã che)
company_name string (PII)
industry_code string
industry_name string
revenue_tier enum
founded_year int
Trường dữ liệu cá nhân (đỏ) không được truy vấn trực tiếp · Trường đã che (vàng) chỉ dùng để ghép bảng.

Bảo mật

Dữ liệu không rời nguồn
Laplace noise auto-injected
k-anonymity enforced (≥100)
SELECT * bị chặn
Chỉ ghép bảng trên các khóa đã che
Mọi query ghi NDAChain
Export kết quả cần approval

Thông tin session

Bắt đầu14:32 · 03/04
Hết hạn14:32 · 10/04
Queries đã chạy42
Thời gian hoạt động4h 18m
Chi phíBao gồm trong gói

Giải thích thuật ngữ bảo mật

Hiểu rõ 4 tham số chính của Phòng sạch dữ liệu (Clean Room)

Cường độ bảo mật (ε / Epsilon)

Kiểm soát độ mạnh của quyền riêng tư. Hệ thống thêm nhiễu ngẫu nhiên vào kết quả query: ε càng nhỏ → nhiễu càng lớn → cá nhân càng khó bị lộ, nhưng kết quả kém chính xác hơn.

💡 ε = 1.0 là mức tiêu chuẩn — bảo mật mạnh mà vẫn đủ chính xác cho phân tích thống kê.

Xác suất rò rỉ (δ / Delta)

Xác suất nhỏ mà cơ chế bảo vệ có thể thất bại. Cặp (ε, δ) cùng nhau đảm bảo: với xác suất ≥ (1−δ), kết quả không lộ thông tin cá nhân nhiều hơn mức ε cho phép.

💡 δ = 1e-5 nghĩa là 1/100.000 query có thể rò rỉ — đây là chuẩn công nghiệp.

k-ẩn danh (k-anonymity)

Mỗi bản ghi trong kết quả phải ẩn trong nhóm có ít nhất k cá nhân giống nhau về các thuộc tính nhận dạng (tuổi, giới, địa chỉ...). Nếu không đủ, query sẽ bị từ chối hoặc gom nhóm lớn hơn.

💡 k ≥ 100 nghĩa là mỗi người ẩn trong đám đông ≥100 người — rất khó nhận diện cá nhân.

Hạn mức riêng tư (Privacy Budget)

Tổng lượng ε được phép tiêu thụ trong một session. Mỗi query tiêu một phần hạn mức. Khi dùng hết, session đóng để ngăn rò rỉ tích lũy khi chạy quá nhiều query.

💡 Ví dụ: budget = 5.0 ε · query 1 tiêu 0.08 · query 2 tiêu 0.12 · ... khi cạn phải mở session mới.