Home
首页
大数据
数据库
Search
Search
Toggle menu
首页
大数据
Matlab
正文
Matlab 中 SMOTE 代码 | 高级特征工程技术
Matlab
24
ZIP
3.77MB
2024-04-30
#特征工程
#不平衡数据处理
#特征合成
#异常值检测
#缺失值处理
SMOTE 代码演示了创建新特征、检测异常值、处理不平衡数据和估算缺失值的先进特征工程技术。
使用 SMOTE 重新采样不平衡数据
使用深度特征合成创建新特征
使用迭代输入器和 CatBoost 处理缺失值
使用 IsolationForest 进行异常值检测
相关推荐
高级特征工程II
高级特征工程的进阶玩法讲得挺细,尤其是一些靠数据本身衍生出来的统计特征、最近邻特征和矩阵分解,思路上都比较实战。像用groupby搞出来的均值、中位数,还能按 KNN 找邻居做交互特征,这些操作在比赛和业务里都挺常用的。 文档里提到的自动特征生成这块,也挺有意思。虽然没点名用的是哪几个工具,但看意思应该涵盖了像Featuretools、Kats、TSFresh那类能自动撸特征的库,适合你想少写点代码但又不想漏掉特征的人。 矩阵分解也讲到了,主要就是把原始稀疏矩阵压缩成一堆稠密的“隐因子”,这类特征对推荐系统或者 CTR 模型挺有用。注意点是它是有损的,不能乱用。 整体阅读感受还不错,语言不绕,
算法与数据结构
0
2025-07-05
大数据工程技术人员的关键角色
随着信息技术的快速发展,大数据工程技术人员在各行各业中扮演着越来越重要的角色。他们通过数据分析和技术创新,为企业提供关键性的支持和解决方案。大数据工程技术人员不仅仅是数据的处理者,更是信息时代的战略参与者,推动着企业的发展和创新。
spark
7
2024-09-13
SMOTE的Matlab代码实验室中的随机森林应用
在这个实验中,您将使用提供在files_for_lab文件夹中的CSV文件。任务要求应用随机森林算法,但限制条件是必须使用SMOTE进行数据增强。请注意,由于SMOTE仅适用于数值数据,因此我们将首先对分类变量进行编码。
Matlab
15
2024-08-13
特征工程实战指南
掌握特征工程的基础知识与应用技巧,提升机器学习模型性能。
数据挖掘
23
2024-05-16
化繁为简:特征工程轻松上手
化繁为简:特征工程轻松上手 无需复杂操作,简单几步,轻松处理数据,实现高效特征工程。
算法与数据结构
14
2024-05-19
特征工程的精华汇编
这本书籍非常适合初学者,涵盖了特征预处理的重要内容。
算法与数据结构
12
2024-07-15
科学与工程中的高级数学方法
科学与工程专业人员的应用数学方法教程
算法与数据结构
23
2024-04-30
工程博客中的Matlab编程王代码的创新应用
Awesome Engineering Blogs公司介绍了Matlab编程在工程领域的广泛应用。AdRoll、Airbnb、Allegro.tech等公司都在使用Matlab进行工程创新。AWS、Atlassian和Autodesk等公司也在他们的工程实践中采用了Matlab技术。
Matlab
14
2024-07-31
MATLAB图像处理中的区域特征提取技术
关于MATLAB数据图像处理中的区域特征提取,包括面积、质心等内容。
Matlab
18
2024-09-27