image/svg+xml
醫療大數據研究的兩難 洪朝貴朝陽資管/軟體自由協會/科技與社會學會
資料探勘/資料科學
統計學
大數據
人工智慧
機器學習
深度學習
參考 kdnuggets及 analyticsvidhya
資料庫多目標最佳化正規表示式...
顏色圖例:問題領域方法/技術
販售價值
使用價值
風險管理
創新觀點
擴散觀點
產學合作
專利
STS
『deep learning frameworks』
證照
自由軟體
通識
『OLPC 訂單之外的議題』
我是黑手 (+ 烏鴉)
configurecompilelinkdependencyversion...
刪掉 Primiary Key及其他所有 keys 抹平 Quasi-Identifier(降低解析度)
k-anonymity:(模糊化後)我跟很多人撞臉 l-diversity:跟我撞臉的人敏感資料數值有各種排列組合
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
-4
-3
-2
-1
0
1
2
3
4
gnuplot_plot_1
gnuplot_plot_2
gnuplot_plot_3
gnuplot_plot_4
gnuplot_plot_5
t-closeness:每一組撞臉家族的敏感資料分佈都差不多
有利保護隱私的資料+調整策略:- 筆數多- 分組粗略- QI 欄位少- 敏感欄位?
PrivyNet(Meng Li, et al.)
neural networkprivacy homomorphic(Hervé Chabanne, et al.)
MITRE Identification Scrubber Toolkit:消除英文文字描述當中的敏感字串 deidentify (github): 同上 ARX Data Anonymization Tool :k-anonymity, ℓ-diversity, t-closeness,δ-disclosure privacy, δ-presence 及更多!
隱私保護工具
『雲端洩密典範』