无监督学习大纲
什么是无监督学习
无监督学习的类型
聚类
降维
异常检测
无监督学习的应用
客户细分
模式识别
欺诈检测
算法与数据结构
9
2024-04-30
利用深度稀疏自动编码器实现高维矩阵降维与特征提取
深度稀疏自动编码器(Deep Sparse Autoencoder, DSAE)是一种神经网络模型,用于学习数据的非线性表示,特别是在高维数据的降维和特征提取方面表现出色。在本场景中,我们使用MATLAB编程环境来实现这一技术,以处理节点相似度矩阵。
自动编码器(Autoencoder, AE)是无监督学习的一种,由编码器(Encoder)和解码器(Decoder)两部分组成。编码器将输入数据压缩为低维的隐藏表示,而解码器则尝试从这个隐藏表示重构原始输入。深度自动编码器具有多层隐藏层,可以捕获更复杂的非线性结构。
稀疏自动编码器(Sparse Autoencoder, SAE)引入了稀疏性约束
算法与数据结构
8
2024-10-31
深入理解大数据Spark ML监督与无监督学习实战指南
在本篇文章中,我们将专注于大数据Spark ML机器学习的核心内容,涵盖监督学习和无监督学习的关键方法。主要涉及以下几种算法:
1. 分类算法
分类算法在监督学习中应用广泛,如逻辑回归和决策树,适用于对数据进行类别标记并进行准确预测。
2. 回归算法
回归算法帮助我们在监督学习中构建精确的预测模型,例如线性回归和支持向量机,尤其适用于数值预测。
3. 聚类算法
在无监督学习中,聚类算法用于将数据点分成组,如K-means和层次聚类,适用于数据分组和发现隐藏模式。
4. 推荐算法
推荐算法广泛应用于个性化推荐系统,通过分析用户行为数据生成个性化推荐,如协同过滤算法。
5. 频繁模式挖掘算法
此类
算法与数据结构
8
2024-10-26
Matlabsvr代码香草时间池的无监督特征学习
Vanilla Temporal Pooling是由中国哈尔滨工业大学语音实验室的Jiqing Han和Shiwen Deng开发的一种音频信号无监督时序特征学习方法。该方法利用非线性支持向量回归(SVR)直接连接BoAW直方图序列与时间索引,有效地捕获任意持续时间的音频信号时间动态模型。此外,为了提升特征表示的信号重构能力,我们还嵌入了稀疏编码方法于传统的BoAW框架中。如果您对我们的研究感兴趣,请引用:@article{zhang:2018:temporal pooling, title={Unsupervised Temporal Feature Learning Based on Sp
Matlab
8
2024-08-18
机器学习半监督学习实战指南
机器学习领域的研究者和从业者,这份半监督学习教程将为你揭开这一技术的奥秘,带你领略如何利用有限的标记数据和大量的未标记数据提升模型性能。
数据挖掘
9
2024-05-27
特征提取器优化预训练网络中的特征提取方法
该工具允许从任何预训练的神经网络中提取图像特征,并提供功能:1. 数据加载和存储;2. 特征提取和规范化;3. 自定义模型特征管理。应用于机器学习和图像处理领域。
Matlab
12
2024-08-17
基于VGG16特征和M3C聚类的微观结构无监督分类
本研究利用VGG16卷积神经网络对微观结构图像进行特征提取,并结合M3C聚类算法实现无监督分类。
数据与方法:
本研究使用包含1925张图像的数据集,从中随机选取100张进行分析。 首先,利用预训练的VGG16网络提取图像特征,具体而言,使用第五个卷积层的输出,并进行平均池化以降低特征维度。 接着,使用M3C聚类算法对提取的特征进行聚类分析,确定最佳聚类数量。 最后,利用项目共识值识别高置信度和不明确的数据,用于后续半监督学习框架的训练。
数据共享:
Python、R和Matlab之间的数据共享通过Excel文件实现。
所需软件包:
Python: Keras, Numpy, Xlsx
Matlab
13
2024-05-31
半监督学习构建和应用半监督机器学习模型
利用LASSO进行特征选择,并采用半监督方法训练K-最近邻、支持向量机、随机森林和神经网络之一。
Matlab
12
2024-07-31
karateclub无监督学习图形的API导向开源Python框架(CIKM 2020)
空手道俱乐部(Karate Club)是一个无监督学习的扩展库,专注于图形数据。它集成了最先进的方法,可用于节点和图级别的网络嵌入技术,并提供各种重叠和不重叠的社区检测方法。该框架涵盖了广泛的网络科学、数据挖掘、人工智能和机器学习领域,适用于多个会议、研讨会和期刊。新引入的图分类数据集可从相关资源获取。如果空手道俱乐部及其数据集对您的研究有帮助,请考虑引用相关文献。
数据挖掘
13
2024-07-20