此存储库包含我完成的清华大学机器学习和数据挖掘课程项目。
清华机器学习与数据挖掘课程项目
相关推荐
利用机器学习挖掘心电数据的项目
该项目基于机器学习方法,利用心电数据开展研究。项目中提供了相关工具,包括:- 解析心电数据注释的 MATLAB 程序- 心脏疾病类型及其数字/字母注释- 生理数据库工具包,用于解读生理数据库中的数据和注释文件
Matlab
2
2024-05-23
机器学习与数据挖掘的探索
这篇文章的内容较为概要,主要用于初学者入门。
数据挖掘
3
2024-07-17
贷款数据分析与机器学习项目
本项目分析商业贷款组合中的风险和损失债务,通过人口统计、业务和部门特征进行详细统计分析。使用机器学习模型预测贷款还款前景,提高贷款管理效率。
统计分析
3
2024-07-15
数据挖掘机器学习
使用 Spark、PySpark、Spark 管道、Jupyter Notebook 学习数据挖掘机器学习
数据挖掘
4
2024-05-15
CS155 机器学习与数据挖掘
卡尔科技 CS155 荣誉守则:未经授课教授允许,请勿使用该课程中的内容。
数据挖掘
2
2024-05-15
Draft 2020-04-06 085708-机器学习数据挖掘项目
数据集在数据科学和机器学习项目中扮演关键角色,它包含用于训练和验证模型的数据。在名为“Draft 2020-04-06 08:57:08-数据集”的压缩包中,我们发现一个专注于“二手车预测交易价格”的数据挖掘项目,这是一个典型的回归问题。回归问题涉及预测连续数值输出,例如二手车价格。 数据集组成包括: - used_car_train_20200313.csv:训练数据集,包含已知特征和对应的目标变量(交易价格),用于训练机器学习模型。模型通过学习数据来理解特征与价格的关系。 - used_car_testA_20200313.csv:测试数据集,仅包含特征,不包含目标变量。用于评估模型在未见数据上的表现。 - used_car_sample_submit.csv:可能是一个提交样例文件,展示如何根据测试数据生成预测结果的格式,通常用于竞赛或在线平台的提交。 - 数据说明.txt:提供数据集的详细信息,包括特征含义、缺失值处理和异常值检测等,对于理解和预处理数据至关重要。 数据预处理阶段通常包括: 缺失值处理、异常值检测、特征工程和类别编码。在选择回归模型时,考虑线性回归、决策树、随机森林和梯度提升机等模型,以适应不同的数据和复杂性需求。 训练和验证模型的过程中,使用交叉验证确保模型泛化能力,并优化损失函数如均方误差(MSE)或平均绝对误差(MAE)。
数据挖掘
0
2024-09-14
数据挖掘与机器学习回归算法优化实验
数据挖掘和机器学习领域中,回归算法广泛应用于预测连续数值型输出。回归分析帮助理解输入变量对输出变量的影响,在金融预测、销售预测和天气预报等实际问题中至关重要。实验“数据挖掘与机器学习:回归算法优化”包括线性回归、逻辑回归、多项式回归、岭回归与Lasso回归、支持向量回归(SVR)、随机森林回归和梯度提升回归(GBRT)等内容。评估指标包括均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)和决定系数(R²),同时介绍模型选择与调参方法。聚类算法如K-means也可能作为预处理步骤。
数据挖掘
0
2024-08-24
机器学习课程代码汇编
吴恩达机器学习编程作业(MATLAB实现)
林轩田机器学习基石课程编程作业(MATLAB实现)
吴恩达机器学习编程作业:
作业一Q15-17
作业一Q18-20
作业二Q16-18
作业二Q19-20
林轩田机器学习基石课程编程作业:
作业三Q7-10
作业三Q13-15
作业三Q18-20
作业四Q13-20
Matlab
2
2024-05-31
数据挖掘(机器学习)课程报告及Weka源码及相关论文
是在蒋良孝老师指导下完成的课程报告。报告涵盖了四个改进思路:1. 通过查阅论文、自行思考和实验验证后完成;2. 源码位于Weka的src/main/java/weka/classifiers/wangliyu/ID3,包含报告前三个改进思路的代码,可供参考;3. 上传此文为有需要的同学提供一些指导。
数据挖掘
1
2024-07-20