随着技术的进步,商务智能和决策系统成功的关键在于从万维网上精选和应用高质量信息。万维网资源因其高动态性、高自主性、数据海量和多样化信息类型,以及不同应用需求等特点,面临着严峻的信息质量问题。国内外研究已开始关注万维网资源质量的挖掘。分析了商务智能等高级应用对Web资源和信息质量的需求,指出了Web资源质量带来的挑战,并综述了现有的Web资源质量模式发现与评估方法。进一步探讨了应用数据挖掘及相关技术来处理Web资源质量异常的原理,强调了Web资源质量挖掘领域亟需解决的问题和挑战。
基于万维网的资源质量模式挖掘技术分析 (2010)
相关推荐
频繁图模式挖掘质量管理过程分析
论文分析了频繁图模式挖掘的质量管理过程,探讨了影响质量的因素和管理策略。
数据挖掘
3
2024-05-01
XML在Web挖掘中的因果模式应用(2010年)
这篇文章定义了一种包括因果关系、因果集合、影响度和分类权值等参数的模式。结合统计分析和其他数据挖掘算法,利用XML的优势构建了一种Web挖掘模型。该模型不仅能够发现Web上事物之间的内在联系和规律,还能为任务执行提供预测和决策支持。实际应用证明,该模型有效可靠,对预测和决策具有重要作用。
数据挖掘
2
2024-07-16
数据挖掘:探索数据模式的技术
数据挖掘技术涵盖关联分析、分类、聚类、文本挖掘、Web 挖掘、图形挖掘以及流和时间序列挖掘等领域。通过学习数据挖掘,您可以:
掌握数据挖掘和知识发现(KDD)的过程。
分析不同数据挖掘和 KDD 算法的适用性。
设计算法解决分类、聚类问题,并从数据库中识别关联规则。
应用文本挖掘、Web 挖掘、图挖掘以及流和时间序列挖掘的概念和算法。
评估数据挖掘和 KDD 算法的性能,比较和对比不同算法的性能。
评估数据挖掘算法的可伸缩性。
分析影响数据挖掘效率的数据特征。
检查数据挖掘和 KDD 算法的局限性。
数据挖掘
6
2024-05-21
模式矩阵数据挖掘技术的新视角
模式矩阵通常采用矢量表示数据对象,每个矢量在多维空间中描述对象的多方面特征。每个维度代表一个特征,多个对象的矢量形成模式矩阵(Pattern Matrix),即(xij)mn。每行表示一个对象,每列描述一个特征。这种方法在数据挖掘中具有重要应用价值。
Hadoop
1
2024-07-15
基于日志文件的数据挖掘技术分析与研究
数据挖掘的定义及其在分析日志数据挑战中的应用原因被介绍。讨论了企事业单位计算机信息系统安全的加强对日志数据挖掘的需求,并总结了具体应用。
数据挖掘
2
2024-07-17
基于贝叶斯方法的序列模式挖掘
序列模式挖掘算法本算法结合贝叶斯学习,简化挖掘过程,可处理不完备、溢出及噪声数据。
概率模型使用概率论模型描述序列,并利用贝叶斯知识辅助。
算法性能经复杂度分析和性能验证,该算法具有优越性。
数据挖掘
3
2024-05-25
基于GPS轨迹的周期模式挖掘方法探讨
针对周期行为挖掘中时空数据采样频率不确定、数据稀疏和时空数据噪声等问题,采用GMPF(GPS Multi-Periodic Find)算法探索用户的周期模式。该方法首先将用户轨迹序列转换为兴趣点集合,然后针对每个兴趣点进行周期挖掘。在微软亚洲研究院的Geolife项目中,利用182名用户4年的GPS数据进行了验证实验,证明了该方法的有效性,对数据噪声和稀疏性具有较好的适应性。
数据挖掘
2
2024-07-16
数据挖掘技术在网页个性化推荐系统中的应用分析(2010年)
探讨了如何利用数据挖掘技术,分析网站日志文件和用户浏览行为,建立网页个性化推荐系统,以改善网站页面设计,更符合用户个人喜好,有效缩短用户搜索时间。详细讨论了数据挖掘与个性化推荐系统的关系,网站日志文件的作用,以及用户浏览行为分析的核心作用。另外,介绍了网页相关性分析的方法和构建个性化推荐系统的步骤,还强调了验证推荐系统效果的重要性。最后,还涉及到数据过滤和偏好度计算这两项关键技术,以及在系统设计中如何保护用户个人信息的问题。
数据挖掘
0
2024-10-02
基于WEKA的数据挖掘分析技术在金融领域的应用
本案例利用WEKA软件进行数据挖掘分析,针对金融领域的大数据进行了聚类分析,比较了随机森林、支持向量机等多种算法,得出了关键结论。
算法与数据结构
0
2024-08-11