Phân tích rủi ro tín dụng SME
SQL Query Editor
Chỉ SELECT + aggregate được phép · Output tự động thêm noise
-- Phân tích phân bố điểm tín dụng SME theo ngành nghề -- Budget dự kiến: 0.12 epsilon (sẽ còn 20% sau query này) SELECT dn.industry_code, dn.industry_name, COUNT(*) AS total_sme, AVG(tc.credit_score) AS avg_score, STDDEV(tc.credit_score) AS score_stddev, PERCENTILE_CONT(0.5) WITHIN GROUP (ORDER BY tc.credit_score) AS median_score FROM dv_dn_042.companies dn INNER JOIN dv_tckt_001.credit_scores tc ON dn.mst = tc.mst WHERE dn.revenue_tier = 'SME' AND tc.score_date >= '2026-01-01' GROUP BY dn.industry_code, dn.industry_name HAVING COUNT(*) >= 100 -- k-anonymity enforcement ORDER BY avg_score DESC LIMIT 20;
Kết quả (với differential privacy noise)
| Ngành | Số DN | Điểm TB | Stddev | Median |
|---|---|---|---|---|
| Công nghệ thông tin | 2.847 | 742.4 | ±84.2 | 748 |
| Tài chính - NH | 1.284 | 718.8 | ±92.1 | 720 |
| Thương mại điện tử | 842 | 684.2 | ±78.4 | 688 |
| Sản xuất công nghiệp | 3.124 | 672.1 | ±88.6 | 670 |
| Bán lẻ & phân phối | 4.280 | 648.4 | ±94.8 | 645 |
| Logistics & vận tải | 1.842 | 634.2 | ±82.4 | 638 |
Lịch sử query
Mọi query đều được ghi NDAChain để audit
Schema
Bảo mật
Thông tin session
Giải thích thuật ngữ bảo mật
Hiểu rõ 4 tham số chính của Phòng sạch dữ liệu (Clean Room)
Cường độ bảo mật (ε / Epsilon)
Kiểm soát độ mạnh của quyền riêng tư. Hệ thống thêm nhiễu ngẫu nhiên vào kết quả query: ε càng nhỏ → nhiễu càng lớn → cá nhân càng khó bị lộ, nhưng kết quả kém chính xác hơn.
💡 ε = 1.0 là mức tiêu chuẩn — bảo mật mạnh mà vẫn đủ chính xác cho phân tích thống kê.
Xác suất rò rỉ (δ / Delta)
Xác suất nhỏ mà cơ chế bảo vệ có thể thất bại. Cặp (ε, δ) cùng nhau đảm bảo: với xác suất ≥ (1−δ), kết quả không lộ thông tin cá nhân nhiều hơn mức ε cho phép.
💡 δ = 1e-5 nghĩa là 1/100.000 query có thể rò rỉ — đây là chuẩn công nghiệp.
k-ẩn danh (k-anonymity)
Mỗi bản ghi trong kết quả phải ẩn trong nhóm có ít nhất k cá nhân giống nhau về các thuộc tính nhận dạng (tuổi, giới, địa chỉ...). Nếu không đủ, query sẽ bị từ chối hoặc gom nhóm lớn hơn.
💡 k ≥ 100 nghĩa là mỗi người ẩn trong đám đông ≥100 người — rất khó nhận diện cá nhân.
Hạn mức riêng tư (Privacy Budget)
Tổng lượng ε được phép tiêu thụ trong một session. Mỗi query tiêu một phần hạn mức. Khi dùng hết, session đóng để ngăn rò rỉ tích lũy khi chạy quá nhiều query.
💡 Ví dụ: budget = 5.0 ε · query 1 tiêu 0.08 · query 2 tiêu 0.12 · ... khi cạn phải mở session mới.