CSX460: 加州大学伯克利分校实用机器学习R 课程仓库
这是加州大学伯克利分校实用机器学习R (CSX460) 的课程仓库,最近的课程是 2017 年春季。
课程说明
本课程使用 R(一种开源统计编程语言)介绍机器学习。机器学习(有时也称为统计学习或数据挖掘)曾经是统计学家、程序员和量化分析师的一套利基工具,现在已经成为各种应用程序和学科不可或缺的工具。
本课程教授机器学习的基础知识,而无需深入研究太多数学或代码。本课程将教授机器学习的实践方面。
完成课程后,学生将能够应用课程,在自己的工作中使用机器学习解决问题。
课程学习目标
通过本课程,学生将学习:
- 机器学习中的基本概念
- 有监督、无监督、半监督、自适应/强化学习之间的区别
- 机器学习算法/模型的三个先决条件
- 损失函数
- 受限函数类
- 训练搜索方法
- 如何评估和比较机器学习模型性能
- 如何预处理数据和构建特征
- 如何训练机器学习模型进行预测、分类和推荐
- 如何在新数据上应用机器学习模型
- 如何使用重采样技术计算模型性能
- 引导程序是什么以及它是如何工作的
- 什么是 Bagging 以及它如何以及为何提高模型性能
- 什么是 Boosting 以及它如何以及为何提高模型性能