高效用模式挖掘领域复杂性使得提升其算法效率成为数据挖掘的重点研究。HUPminer算法是基于垂直模式类的典型方法,有效减少效用列表数量,但其对项集划分的需求仍占用大量空间。为解决这一问题,改进的IHUI-miner算法在考虑1扩展集中项集关联性的基础上,显著减少效用列表的个数。实验验证显示,IHUI-miner在时间效率和效用列表减少方面均优于现有算法HUP-miner与HUI-miner。
提高垂直模式类高效用模式挖掘算法的效率
相关推荐
面向高效数据挖掘的直接判别模式挖掘
DDPMine 运用 branch-and-bound 搜索策略,无需生成完整模式集,直接挖掘出区别性模式。该方法摒弃了从海量数据中选取最优模式的传统做法,引入以特征为中心的策略,通过不断减少训练实例,在逐步缩减的 FP 树上依次生成区别性模式。
数据挖掘
2
2024-05-27
数据挖掘技术一种高效的最大频繁模式挖掘算法
挖掘最大频繁模式是数据挖掘中的核心问题之一。提出了一种快速算法,利用前缀树压缩数据存储,通过优化节点信息和节点链,直接在前缀树上采用深度优先策略进行挖掘,避免了传统条件模式树的创建,显著提升了挖掘效率。
数据挖掘
2
2024-07-20
PrefixSpan:GSP 序列模式挖掘算法
基于优先级原则的序列模式挖掘算法
通过产生并检测候选序列的方式
扫描序列数据库,得到长度为 1 的序列模式
根据种子集生成候选序列模式,计算支持数
迭代上述步骤,直到没有新序列模式或候选序列模式产生
算法与数据结构
3
2024-05-15
频繁模式挖掘算法:观测研究
频繁模式挖掘在数据挖掘中扮演着关键角色,存在多种算法。本研究探索了模式连续挖掘中算法相关的主要问题和挑战。
数据挖掘
5
2024-05-25
序列模式-数据挖掘算法解析
序列模式t是指在多个数据序列中发现共同的行为模式。 t通过时间序列搜索出重复发生概率较高的模式,强调时间序列的影响。 例如,在所有购买了激光打印机的人中,半年后80%的人再购买新硒鼓,20%的人用旧硒鼓装碳粉; 在所有购买了彩色电视机的人中,有60%的人再购买VCD产品; 在时序模式中,需要找出在某个最短时间内出现比率一直高于某一最小百分比(阈值)的规则。
数据挖掘
2
2024-07-15
序列模式-数据挖掘算法解析
序列模式t是指在多个数据序列中发现共同的行为模式。t通过时间序列搜索出重复发生概率较高的模式。这里特别强调时间序列的影响。例如,在所有购买了激光打印机的人中,半年后80%的人再购买新硒鼓,20%的人用旧硒鼓装碳粉;在所有购买了彩色电视机的人中,有60%的人再购买VCD产品;在时序模式中,需要找出在某个最短时间内出现比率一直高于某一最小百分比(阈值)的规则。
数据挖掘
0
2024-10-17
一种高效挖掘最大频繁模式的新算法(2006年)
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种新算法,利用前缀树压缩数据存储,并通过深度优先策略直接在前缀树上进行挖掘,避免了条件模式树的创建,大幅提升了挖掘效率。该算法调整节点信息和节点链,采用高效的策略处理数据集,以应对大规模数据挖掘的需求。
数据挖掘
0
2024-08-31
基于优化数据集结构的高效用数据挖掘算法研究
高效用项集挖掘 (High-Utility Itemset Mining, HUIM) 作为数据挖掘领域的重要任务之一,与频繁项集挖掘 (Frequent Itemset Mining, FIM) 不同,HUIM 在挖掘过程中会综合考虑数量和价值等因素。
数据挖掘
6
2024-05-23
Python编程实现序列模式挖掘算法
利用Python编程语言实现数据挖掘中的序列模式挖掘算法。
数据挖掘
0
2024-09-13