针对传统k度匿名隐私保护方法在图结构中易受结构性背景知识攻击的问题,提出了一种基于社区划分的改进方法。该方法将网络节点分为社区内节点和连接社区的边缘节点两类,并通过不同的匿名化策略实现了社区内节点的度匿名和边缘节点的社区序列匿名,有效提升了整个社交网络的k度匿名保护水平。实验证明,该方法不仅降低了数据实用性损失,还能抵抗基于节点度和节点所在社区关系的背景知识攻击。
基于社区划分的改进k度匿名隐私保护方法
相关推荐
数据隐私与数据效用的平衡关于k-匿名性的权衡说明
研究人员经常利用多个数据集进行可信的计量经济学和统计分析。为确保数据链接的可靠性,他们通常依赖于唯一标识符。然而,这种联系可能会泄露个人的敏感信息,因此数据管理者可能会删除私人数据集中的某些个人信息以保护隐私。数据管理员保留的信息仍然允许研究人员链接数据集,尽管可能会出现一些错误。k-匿名性是一个解决隐私与数据链接之间平衡的概念框架,在实践中有着广泛的应用。从研究人员和数据管理者的角度探讨了数据组合和估计任务,强调了k-匿名性对数据管理和研究的重要性及其影响。
统计分析
5
2024-07-17
基于极大关联属性集分解的高维数据隐私保护方法
在高维数据匿名发布中,传统的抽象化技术易造成信息缺损,导致发布数据在实际应用中的价值下降。而分解技术虽然确保了数据真实性,却因视图划分破坏了属性间的内在关联,进一步限制了数据的可用性。针对这一问题,该文提出了基于极大关联属性集的分解法(MAAD)。MAAD借助频繁模式挖掘技术,寻找具有强关联性的属性组,以此指导多视图分解的生成。通过优先考虑属性间的关联性,MAAD生成的多视图在隐私保护与数据挖掘性能之间实现了平衡。
数据挖掘
0
2024-10-26
Hadoop 安全与隐私保护
Hadoop 安全机制保障了大数据平台数据隐私与安全,有效防御外部攻击和内部威胁。
Hadoop
4
2024-05-01
序列模式挖掘隐私保护研究
针对序列模式挖掘中的隐私保护问题,研究人员提出了名为CLDSA(当前最少序列删除算法)的创新算法。
该算法通过对候选序列进行加权,并在删除过程中动态更新权重,以贪心算法获得局部最优解,从而最大限度地减少对原始数据库的修改。
实验结果验证了CLDSA算法在隐藏敏感序列方面优于现有方法,实现了更有效的隐私保护。
数据挖掘
5
2024-04-30
隐私保护数据挖掘前沿研究
随着移动互联网、物联网等技术的蓬勃发展,个人隐私数据面临着前所未有的侵犯风险。隐私保护数据挖掘成为数据挖掘领域的热点,研究者们针对移动端、分布式系统、高维数据和时空数据等场景下隐私保护问题,提出了多种方法和算法,取得了丰硕的成果。
数据挖掘
4
2024-05-13
基于划分的聚类算法-K-prototypes算法
K-prototypes算法是结合了K-Means与K-modes算法,专门用于处理混合属性数据。它解决了数值属性和分类属性同时存在的情况。具体而言,数值属性通过K-means方法得到聚类中心P1,而分类属性则通过K-modes方法得到聚类中心P2。然后,通过加权组合这两个中心来计算距离度量D,权重a决定了分类属性在计算中的重要性。更新簇中心的方法结合了K-Means与K-modes的更新策略。
算法与数据结构
2
2024-07-13
Echarts地图绘制镇区划分
使用Echarts库根据指定数据生成地图,支持缩放、漫游等操作,并提供点击事件处理,实现不同区域的交互功能。地图展示广东省的镇区划分,采用分段式视觉映射显示风险等级,并提供悬浮提示显示区域名称。
算法与数据结构
3
2024-05-12
永远在线时代:隐私衡量与保护
永远在线时代:隐私衡量与保护
数据挖掘在互联时代得到了极大的加强,从互联网到物联网 (IoT),用户通过电视、智能手机、可穿戴设备和计算机化的个人助理等各种方式连接到互联网。许多设备以“永远在线”模式运行,不断接收和传输数据,物联网设备的增加使用可能导致社会进入“永远在线”时代,个人数据不断被收集。
当前的隐私监管方法本质上是部门性的,仅在特定背景下保护隐私,并且仅针对特定的行业或群体,因此个人隐私面临巨大风险。然而,严格的隐私监管可能会对数据效用产生负面影响,尤其是在技术发展和创新方面。
数据效用和隐私保护之间的权衡需要新的解决方案,而差异隐私方法可能会有很大帮助。该方法建议在被视为敏感的数据中添加“噪声”,具体取决于数据敏感的可能性。换句话说,使用计算解决方案结合衡量数据敏感概率的公式,隐私可以在“永远在线”时代得到更好的保护。
物联网服务提供商可以结合法律和计算方法来优化数据效用和隐私之间的平衡。部门方法下的隐私保护及其价值需要被评估。技术变革如何塑造行业监管,物联网设备如何影响隐私,以及新监管机制应对“永远在线”时代挑战的潜在适用性都需要被探讨。
针对当前监管框架在保护个人隐私方面的局限性,技术可以作为一种解决方案。依赖于差异隐私的新计算模型和私有核心集等现代技术可以被使用。在用户端的数据中引入“噪声”可以保护个人隐私,同时使服务提供商能够利用数据。
核心内容
探讨“永远在线”时代数据挖掘带来的隐私挑战。
分析现有部门性隐私监管方法的不足。
提出基于差异隐私和“噪声”添加的技术解决方案。
探讨法律和计算方法结合,平衡数据效用和隐私保护。
数据挖掘
6
2024-05-25
MapReduce环境下支持差分隐私的k-means聚类方法
针对传统隐私保护方法无法应对任意背景知识下恶意分析的问题,本研究提出了在分布式环境中使用MapReduce计算框架实现的差分隐私保护k-means算法。该方法由主任务控制k-means迭代执行;Mapper分任务独立并行计算数据片中记录与聚类中心的距离,并标记其所属聚类;Reducer分任务计算同一聚类中的记录数量和属性向量之和,并利用Laplace机制生成的噪声扰动数据,实现隐私保护。理论证明该算法满足ε差分隐私保护的组合特性。实验结果显示,在提升隐私性和时效性的同时,保证了算法的可用性。
数据挖掘
3
2024-07-13