Lecture 1 Introduction

本节最主要就是引入机器学习的元素。教授Rebecca Willett 用一个区分笑脸的任务介绍了机器学习的基本步骤。

E8ql7RHS9sbWGxu

qiHJnFjKYhmzUCo

DvCm1GEyBgfo9VJ

想象我们想用一张脸部图片来决定这个人是否微笑。

关键想法：我们用一个模型表示脸是否在笑——一种数据的数学表示。

基本步骤：

收集原始数据——例如，脸部图像
预处理——不丢失相关信息的条件下，做数据变换来简化后面操作。例如，剪裁图像到标准尺寸，一张图一张脸，脸部在图像中间。
特征提取——通过提取模型相关的特征或特性来简化数据(基于深度神经网络的现代图像识别系统这个步骤不是必须的)。例如，每对脸部坐标的距离。
生成训练样本——我们用来学习模型的大量样本的集合。
- $(x_i, y_I) \quad for \quad i=1, \ldots, n$ 其中， $n ：训练样本数目 \\ y_i ：第i个样本标签\\ x_i ：第i个样本特征\\ x_{ij} ：第个样本的第j个特征$
选择loss function——衡量我们模型预测跟真实值之间的接近程度。 $loss = \sum^n_{i=1}\left|y_{i}-\hat{y}_{i}\right|^{2}$
学习模型——遍历搜索候选模型或模型参数集合来找到一个能在训练集上损失最小的。
泛化误差——我们在新数据集上的的预测误差，不是开始用来训练的数据。