欢迎光临欧宝体育手机版app官网网站!
技术支持
联系方式
市场部:
联系人:郎昊
手机:13265413323
电话:0755-83048260 83048021
传真:0755-83048280
Email:alan@jghcrystal.com
QQ:3004764108
网址:www.haoyuseo.com
位置: 首页 > 技术支持

差分隐私介绍(1)

作者:欧宝体育手机版app官网

发布时间:2023-10-27 13:36:26

浏览量:864

  假设你是一个班级的老师,现在举行了一个重要的考试。你怀疑你们班级有很多同学作弊,你该怎样得到作弊学生的比例呢,很显然,大部分作弊了的同学不愿意诚实地承认自己作弊。

  我们可以把这样的一个问题变得更广义一些。有n个人,每个个体i有一个敏感的布尔值信息(例如有没有糖尿病或是否单身)

  X_{i}\in0,1,任何一个人都不想别人明白自己的敏感信息到底是什么,所以大家发给数据分析人员一个信息Y_{i},Y_{i}取决于X_{i}和某个随机数,基于收集到的Y_{i}信息,数据分析人员想要知道X_{i}=1所占的比值。

  这种情况下,别人没法从Y_{i}推断X_{i}的真实值,但这样我们就没法从收集到的信息里获取到任何真实可用的东西,因为每个人都是像抛硬币一样地提交信息,那收集起来的数据集其实就是一个二项分布,和真实的数据集完全没有关系。

  现在我们有两种关于方案Y_{i}的方案——一种完全准确但完全无法保证隐私,另一种则相反,我们想要的是平衡,既能保证个人隐私也还保留数据可用性。

  我们目前还没有进一步构建正式的数学工具来衡量Y_{i}关于X_{i}的隐私化程度,所以我们这里用一种粗略的方式来讨论。当\gamma=1/2时,我们认为这个是“honest strategy”(诚实的),当\gamma=0时,我们认为是“uniformly random strategy”(一致随机的)。如果当\gamma=1/4呢?那么个人信息在一定程度上存在“plausible deniability”(合理的推诿,翻译渣渣尽力了~~):3/4的可能是上报线的可能上报虚假的信息。通俗地说,上报的信息有多“虚假”和隐私保护水平是对应的。显然,当\gamma=0时,每个人的隐私保护水平更高。

  我们暂时把隐私保护水平的问题放一边,现在看看数据分析人员能够获得多准确的一个估计值。有

  由伯努利随机变量的方差小于等于1/4可推出后面的不等式,并且通过切比雪夫不等式可得下面的关系:

  当n\rightarrow∞,估计的概率与线。综上,如果我们期望两者之间的误差为\alpha,则我们需要n=O(1/\alpha^{2}\gamma^{2})个样本。要注意的是,当\gamma趋于0,误差也会随之增大,如果我们想提高隐私保护水平,同时保持其准确性,我们就需要更多的样本数据。

  为了进一步量化隐私保护程度,我们必须对信息引入一种更普遍的“合理的推诿”——差分隐私。

  在有关安全和隐私方面,尽可能地确保所有环节精确可量化是非常重要的,这样我们才能清楚自己工作的成效如何。我们这样定义了中心差分隐私——有n个主体,X_{1}至X_{n},所有主体把自己的原始数据发送给一个“可信的数据收集者”——能够理解为一个可信的服务器。服务器在这一些数据上跑一个算法M,并通过这一个算法对外发布算法运行后的结果。如果算法M是满足差分隐私的,则意味着没有一个主体的数据能对结果有很大的影响。

关于我们
销售咨询:138-2525-3531


关注我们


在线下单

版权所有  欧宝体育手机版app官网    粤ICP备12048101号
首页
产品展示
地址
电话