起步与KNN

基于卷积神经网络(CNN)的视觉识别

挑战
  1. 视觉点变化,观察的视角差异
  2. 规模尺度变化,巨人与小恶魔
  3. 内容可能是形态可变化的,扭曲的猫
  4. 观察物被遮挡
  5. 光照条件影响及其大
  6. 背景图像的影响
  7. 类型内的影响,比如‘主持人’这一分类范围较广
图片分类流程:
  1. 输入:N张图片组成的数据集,每张图片有一个明确的label
  2. 学习:利用数据集去学习每个label的特征,称之为“训练一个分类器”或“学习一个模型”
  3. 评估:用新的数据集去测试训练好的分类器,计算准确率
Nearest Neighbor Classifier

最近邻分类器和CNN无关、也极少用于实践,但能帮我们了解图片分类问题
思路:对于训练集,读取成为长*宽*3的矩阵。对于测试集,与前面训练集中的图片比较,找出与其最相似的图片则他们分为一类
图片比较方法:
1、计算两矩阵中对应两两位置的差值的和
L1 distance
2、计算两矩阵中对应两两位置的差值的平方和然后再开根号

1
Evaluate on the test set only a single time, at the very end.

1
将您的训练集分成训练集和验证集。使用验证集来调整所有超参数。最后在测试集上运行一次并报告性能。

Nearest Neighbor Classifier 的优缺点:优点:简单易懂,低训练成本。缺点:测试成本过高。逐像素距离根本不对应于感知或语义相似性。

交叉验证

在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。这个过程一直进行,直到所有的样本都被预报了一次而且仅被预报一次。把每个样本的预报误差平方加和,称为PRESS(predicted Error Sum of Squares)。