CSX460: 加州大学伯克利分校实用机器学习R 课程仓库

这是加州大学伯克利分校实用机器学习R (CSX460) 的课程仓库,最近的课程是 2017 年春季。

课程说明

本课程使用 R(一种开源统计编程语言)介绍机器学习。机器学习(有时也称为统计学习或数据挖掘)曾经是统计学家、程序员和量化分析师的一套利基工具,现在已经成为各种应用程序和学科不可或缺的工具。

本课程教授机器学习的基础知识,而无需深入研究太多数学或代码。本课程将教授机器学习的实践方面。

完成课程后,学生将能够应用课程,在自己的工作中使用机器学习解决问题。

课程学习目标

通过本课程,学生将学习:

  • 机器学习中的基本概念
  • 有监督、无监督、半监督、自适应/强化学习之间的区别
  • 机器学习算法/模型的三个先决条件
  • 损失函数
  • 受限函数类
  • 训练搜索方法
  • 如何评估和比较机器学习模型性能
  • 如何预处理数据和构建特征
  • 如何训练机器学习模型进行预测、分类和推荐
  • 如何在新数据上应用机器学习模型
  • 如何使用重采样技术计算模型性能
  • 引导程序是什么以及它是如何工作的
  • 什么是 Bagging 以及它如何以及为何提高模型性能
  • 什么是 Boosting 以及它如何以及为何提高模型性能