介绍了一种新的软聚类算法,名为基于贝叶斯分类的聚类。该算法不需要随机初始化,而是利用本地度量来选择最佳的聚类数。通过最小化可以从软聚类分配中推导出的对数贝叶斯风险来执行聚类,这被视为聚类过程的优化目标函数。算法类似于期望最大化,最小化所提出的聚类功能。此外,该算法已实现CPU和GPU版本。
基于贝叶斯分类的聚类算法软聚类的新方法
相关推荐
基于非参数贝叶斯模型的新型聚类算法(2013年)
聚类分析是机器学习和数据挖掘领域重要技术之一,与监督学习不同,聚类分析无需类别或标签指导,因此如何选择适当的聚类个数一直是难点。为解决这一问题,提出了一种基于Dirichlet过程混合模型的新型聚类算法,采用collapsed Gibbs采样算法对模型参数进行估计。新算法基于非参数贝叶斯模型框架,通过连续采样优化模型参数,实现自适应聚类个数。在人工合成和真实数据集上的实验表明,该算法表现出良好的聚类效果。
数据挖掘
0
2024-08-14
MATLAB中的高效Wasserstein重心离散分布聚类的新方法
在MATLAB中,WBC_Matlab为离散分布聚类提供了一种高效的Wasserstein重心计算方法,特别适用于具有稀疏支持的情况。
Matlab
0
2024-09-27
基于网格的聚类
基于网格的聚类算法是一种能有效发现任意形状簇的无监督分类算法,克服了基于划分和层次聚类方法的局限性。网格方法将数据空间划分为网格,将落在同一网格中的数据点视为同一簇。常见的基于网格的聚类算法包括:- CLIQUE- WaveCluster
数据挖掘
4
2024-05-01
聚类算法对比
该研究深入探讨了数据挖掘中的聚类算法,全面比较了各种算法的优点和局限性。
数据挖掘
4
2024-05-01
选择聚类算法
探索聚类算法以有效提取 Web 数据洞察力。
数据挖掘
3
2024-05-25
基于高斯核的距离和密度聚类算法GDD聚类-matlab开发
请引用:Emre Güngör,Ahmet Özmen,使用高斯核的基于距离和密度的聚类算法,发表于《Expert Systems with Applications》第69卷,2017年,第10-20页,ISSN 0957-4174。详细信息请参阅原始文章链接:https://doi.org/10.1016/j.eswa.2016.10.022 (http://www.sciencedirect.com/science/article/pii/S095741630553X)。对于聚类数据集和/或形状集,您可以查看:https://cs.joensuu.fi/sipu/datasets/
Matlab
0
2024-08-05
基于DBSCAN算法的数据聚类技术
利用JAVA语言设计的面向对象的基于DBSCAN算法的数据分类技术,充分发挥其在数据处理中的优势和效果。
数据挖掘
2
2024-07-13
基于SSE度量的K-means聚类算法聚类个数自适应研究
K均值聚类算法是数据挖掘中常见的无监督学习方法,其簇间数据对象越相异、簇内数据对象越相似,说明聚类效果越好。然而,确定簇个数通常需要有经验的用户设定参数。提出了一种基于SSE和簇的个数度量的自适应聚类方法(简称:SKKM),能够自动确定聚类个数。通过对UCI数据集和仿真数据的实验验证,结果表明改进的SKKM算法能够快速准确地确定数据对象中的聚类个数,提升了算法性能。
数据挖掘
2
2024-07-18
基于密度树的网格快速聚类算法
该算法将网格原理应用于基于密度树的聚类算法,提高效率,降低I/O开销。
数据挖掘
4
2024-05-20