大数据的规模、多模态性和快速增长对传统数据挖掘方法构成了挑战。粒计算作为解决智能信息处理中大规模复杂问题的有效方法,正在探索新的思路和策略应对这些挑战。系统梳理和分析了在几个大数据挖掘任务中取得的进展,包括数据粒化、多粒度模式的发现和融合,以及多粒度和跨粒度推理。此外,针对天文数据挖掘和微博数据挖掘等示范应用领域的初步研究进行了综述,为大数据挖掘领域的进一步探索提供了有益的参考。
面向大数据的粒计算理论与方法的研究进展
相关推荐
面向大数据的 高性能计算:方法与应用
面向大数据的 高性能计算:方法与应用
本书探讨了面向数据密集型应用的新兴高性能架构、提升数据处理效率的新型分析策略,以及机器学习、生命科学、神经网络和神经形态工程等多个领域的前沿应用。
全书结构分为两大部分。第一部分涵盖大数据架构,包括云计算系统和异构加速器,并介绍了面向内存架构和设备的新兴 3D IC 设计原则。第二部分展示了大数据在多个领域的新兴应用案例,包括生物信息学、深度学习和神经形态工程。
主要内容包括:
涵盖 Hadoop/Spark 等分布式系统在内的各种大数据架构
面向大数据应用的基于加速器的解决方案,例如基于 GPU 的加速技术
面向内存架构和设备的新兴 3D IC 设计
算法与数据结构
10
2024-05-23
数据挖掘的研究进展
数据挖掘技术广泛应用于各个领域。其传统任务分类包含分类、聚类、预测等七类,近年来已拓展至社会网络分析、推荐系统等新领域。
数据挖掘
23
2024-04-30
聚类算法研究进展综述
总结聚类算法的研究现状及新进展
分析代表性算法的算法思想、关键技术和优缺点
对典型算法进行实验对比,分析不同数据集和算法的聚类情况
提出聚类分析的研究热点、难点和待解决问题
数据挖掘
21
2024-05-25
AI在医学领域的研究进展与应用
人工智能在医学应用研究进展
摘要人工智能技术在医学领域的应用研究取得了显著的进展。将探讨人工智能在医学中的应用背景和意义、研究现状、方法和成果,并指出存在的问题和挑战,最后提出未来的研究方向和思路。
人工智能在医学应用的重要性
人工智能技术的应用可以帮助医生更准确地诊断和治疗疾病,提高医疗效率,同时也可以帮助医疗机构更好地管理患者健康,降低医疗成本。因此,人工智能在医学中的应用研究具有重要的现实意义和价值。
人工智能在医学应用的主要内容
人工智能在医学中的应用主要包括辅助诊断、治疗、健康管理等方面。在辅助诊断方面,人工智能技术可以通过对患者的医学影像、病理切片等信息进行分析,辅助医生进行更
MySQL
7
2024-11-03
畜禽基因组选择方法的最新研究进展2020
随着科技的进步,畜禽基因组选择方法在2020年已经取得了显著进展。
算法与数据结构
13
2024-07-13
并行的K近邻查询研究进展
并行计算的 k 近邻算法,蛮适合做大规模数据检索优化。论文《并行的 k 近邻查询研究进展》讲得还挺系统的,尤其适合你在高维数据、做图像识别或时间序列相似性搜索时参考。核心思路就是把k-NN查询做并行,比如用多线程或GPU加速,提升性能杠杠的。
想做相似性搜索的可以顺手看看时间序列相似性搜索,里面案例比较丰富,理解起来也轻松些。嗯,做图像相关的还可以看看基于MATLAB的数字识别代码,思路清晰,能直接上手。
如果你在做异构网络,并行化的相似性度量算法这篇也值得一看,和主论文搭配着看更有感觉。对底层实现感兴趣的朋友,别忘了瞄一眼多线程计算的操作指南,讲得蛮细,还带操作步骤。
总结一句:并行 k-N
数据挖掘
0
2025-06-24
时空数据挖掘研究进展
时空数据挖掘的资源挺多,但这个Python 版时空大数据交通挖掘可视化真的还不错。里面的代码结构清爽,逻辑也比较好懂,像交通流量、预测拥堵这些场景,用它挺顺手的。
时空异常检测用的AnomalyDetector MATLAB 代码也值得一试,非参数方法,跑得还挺快。适合用来监测一些突发异常,比如交通事故或者环境异常。
如果你对时空数据的高效感兴趣,时空专用引擎 V7 数据调度组件可以了解一下,调度速度快,数据量大也能扛,适合实时数据场景。
想搞时空模式发现的话,可以直接去看CSC-791 时空数据挖掘代码,里面有现成的模式发现方法,写得比较实用,改一改就能用。
另外,像网络热点事件时空演化与可
算法与数据结构
0
2025-06-30
关联规则挖掘技术的研究进展
综述了关联规则挖掘技术的分类方法、评价方法及其最新进展,特别详细介绍了主要算法,并探讨了未来的发展方向,为进一步研究关联规则挖掘技术提供了全面指导。
数据挖掘
12
2024-08-24
隐私保护数据挖掘研究进展2013
隐私保护数据挖掘的研究真的是越来越卷了,尤其是最近看了一篇 2013 年的综述,虽然时间有点久,但内容还挺有参考价值的。文章把几类常见的隐私保护方法——像数据匿名化、差分隐私、同态加密这些——讲得蛮清楚,适合刚上手或者准备在项目里加隐私模块的同学看看。
移动设备、物联网、社交 APP 的爆发,导致隐私泄露的风险越来越高。这篇文章就比较系统地聊了下在高维数据、时空数据、分布式架构这些新场景下隐私保护挖掘的挑战。说白了,就是传统方法不太好使了,需要更聪明的算法、更稳的模型。
像安全多方计算和同态加密,这些技术听起来高大上,其实背后逻辑也不复杂:多方不互任,但又得一起算点东西,那就用密码学兜底。文章
数据挖掘
0
2025-06-30