互联网平台提供的用户信息授权服务已广泛应用,但在满足第三方网站的数据挖掘需求时,常将用户隐私信息存储在多方,增加了用户隐私滥用和泄露的风险。针对此问题,本研究提出了一种开放平台与网站间的分布式关联规则挖掘算法。该算法无需依赖可信的第三方参与,开放平台和网站各自根据挖掘条件生成布尔型矩阵,以频繁-1项集编号和用户身份标志符为行列标记。开放平台对矩阵进行扰动和整合,网站在整合后的矩阵上挖掘全局关联规则。实验证明,该算法有效且未因通信代价显著降低挖掘效率。
研究报告-面向互联网平台用户隐私保护的分布式关联规则挖掘算法.pdf
相关推荐
互联网+大数据时代的商业分析研究报告
这份文档是关于大数据入门的介绍,涵盖了数据整理、应用方法和加工技术。在互联网和大数据的背景下,这些信息对于商业决策具有重要意义。
算法与数据结构
3
2024-07-13
基于 CanTree 的分布式关联规则挖掘与增量更新算法研究
关联规则挖掘是数据挖掘领域的核心任务之一。近年来,随着数据规模不断扩大,分布式数据库架构以及数据动态变化的特性对关联规则挖掘算法提出了更高的要求。本研究聚焦于 CanTree 数据结构,提出一种高效的分布式关联规则挖掘算法,并设计相应的增量更新机制以适应动态变化的数据环境。
数据挖掘
2
2024-05-25
影响互联网专车平台用户意愿的因素实证研究
随着互联网技术、移动支付技术和智能手机的普及,共享经济为新型经济形态的经营理念带来了快速发展,互联网专车作为其中一种形式逐步兴起。本研究以互联网专车平台为研究对象,在理性行为理论、创新扩散理论及服务业相关研究的基础上,结合技术接受模型(TAM)、理性行为理论的主观规范、创新扩散理论的兼容性特征以及现代服务业特点,将用户使用意愿作为因变量,使用态度作为中介变量,分析感知有用性、感知兼容性、感知价格、主观规范、异质性、即时性和结合性等自变量。通过构建结构方程模型并提出相关假设,设计量表并通过问卷调查获得322份有效数据。最终,利用SPSS进行统计分析和测量指标的信度与效度检验,并通过Amos验证结构方程模型和检验假设的显著性水平。研究结果为互联网专车公司、传统出租车公司及政府部门提供了决策参考意见。
统计分析
0
2024-09-18
大数据互联网大规模数据挖掘与分布式处理
《大数据:互联网大规模数据挖掘与分布式处理》深入探讨了如何高效挖掘和处理互联网产生的大规模数据。本书基于斯坦福大学CS345A课程内容,为高级本科生和初入研究生提供友好的学习资源。重点讲解了处理无法完全装入主内存的大数据集的实践方法。书中覆盖了分布式文件系统、Map-Reduce编程模型、相似度搜索(如MinHashing和局部敏感哈希)、数据流处理及特别算法、搜索引擎技术(如PageRank算法)、频繁项集挖掘(包括A-Priori算法)、以及针对高维数据集的聚类算法。适合希望深入了解和应用数据挖掘与大数据处理技术的专业人士和学生。
数据挖掘
0
2024-10-13
分布式环境下Paillier同态加密的关联规则挖掘
在隐私保护数据挖掘领域,如何在保障数据安全性的前提下,不损失挖掘精度一直是一项挑战。为解决这一问题,我们提出了一种基于Paillier同态加密的关联规则挖掘方法,该方法适用于分布式环境。
方法特点:
计算与解密分离: 采用计算方和解密方分离的策略,有效保障数据挖掘过程的安全性。
精度无损: 利用同态加密特性,在不解密数据的情况下进行计算,确保挖掘精度不受影响。
效率提升: 引入蒙哥马利算法优化Paillier算法,降低计算开销,保证算法效率。
实验结果表明,该方法在引入加解密过程后,整体开销依然处于可接受范围,验证了其在实际应用中的可行性。
数据挖掘
3
2024-05-24
基于局部最优的互联网论坛用户社区挖掘
基于局部最优的互联网论坛用户社区挖掘
为了有效地划分互联网论坛中的用户社区,我们分析用户发言的层次结构和内容,构建用户之间的回复关系图。在此基础上,提出一种基于局部最优的图聚类方法 (LOGCA),用于对大规模论坛网络图进行分类。实验结果成功识别出互联网论坛上多个具有共同兴趣的用户社区。 该方法简单有效,能够从大规模网络数据中挖掘出有意义的用户社区,展现出其在社区发现领域的实用价值。
数据挖掘
3
2024-05-24
分布式环境下保护私有信息的统计量化规则挖掘
统计量化规则(SQ rule)在数据挖掘领域具有重要价值。集中式挖掘SQ规则的算法已得到广泛应用,但其在分布式环境中,尤其是在涉及私有信息保护的情况下,面临挑战。如何在保护各方私有信息的前提下,实现多方协作完成SQ规则挖掘,成为保护私有信息的数据挖掘(PPDM)研究的重点。
基于安全求和、安全求平均和安全求频繁项集等PPDM基本工具,提出了两种算法,用于在水平划分数据下实现保护私有信息的SQ规则挖掘。其中,一种算法能够安全计算置信区间。
数据挖掘
3
2024-05-20
关联规则挖掘的新算法研究
关联规则挖掘一直是数据挖掘中重要的内容之一。提出了DPCFP-growth算法,它是基于MSApirori算法,并采用了CFP-growth分而治之的策略,以弥补原算法的不足。与CFP-growth算法相比,DPCFP-growth算法有效地将大数据库分解为多个小的子数据库,从而提高了算法的运行效率。实验结果表明,DPCFP-growth算法在大型数据挖掘中具有优越性。
数据挖掘
3
2024-07-17
序列模式挖掘隐私保护研究
针对序列模式挖掘中的隐私保护问题,研究人员提出了名为CLDSA(当前最少序列删除算法)的创新算法。
该算法通过对候选序列进行加权,并在删除过程中动态更新权重,以贪心算法获得局部最优解,从而最大限度地减少对原始数据库的修改。
实验结果验证了CLDSA算法在隐藏敏感序列方面优于现有方法,实现了更有效的隐私保护。
数据挖掘
5
2024-04-30