斯坦福大学机器学习课程个人学习笔记（上）

在这篇学习笔记中，我将深入探讨斯坦福大学机器学习课程中的关键概念，这些内容源自Andrew Ng教授的讲义和教学视频。机器学习作为一门多领域交叉学科，致力于通过经验学习方式让计算机自动化地获取知识，而无需显式编程。将重点关注机器学习的基础理论、模型和算法，探索监督学习、无监督学习和半监督学习等不同类型，其中监督学习主要包括回归和分类问题。在回归中，我们预测连续变量如房价；而在分类中，我们将数据分为离散类别如垃圾邮件检测。无监督学习则通过处理未标记数据进行聚类和降维，揭示数据内在结构。接着，我们深入讨论线性回归作为基础模型，其通过最佳拟合直线或超平面预测目标变量，优化目标在于最小化预测与真实值的误差。梯度下降法是优化线性回归参数的主要手段。逻辑回归则用于二分类问题，通过sigmoid函数预测事件概率，适用于多项逻辑回归以处理多分类问题。此外，我们探索神经网络和深度学习的概念，神经网络通过多层节点实现复杂非线性学习，应用于图像识别的CNN和文本处理的RNN。模型评估和选择中的交叉验证和正则化有助于防止过拟合和提升泛化能力。支持向量机（SVM）则通过寻找最优超平面实现不同类别间的最大化间隔，并通过核技巧处理非线性可分数据。这些基础知识为进一步学习和实践机器学习技术奠定了坚实基础，未来笔记将继续探索集成学习、强化学习和聚类算法等高级主题。