博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
自问自答 学习系列(1):从图像分类,到损失函数,到神经网络
阅读量:6992 次
发布时间:2019-06-27

本文共 816 字,大约阅读时间需要 2 分钟。

1.图像分类的挑战:

  • 视角变化(Viewpoint variation:同一个物体,摄像机可以从多个角度来展现。
  • 大小变化(Scale variation:物体可视的大小通常是会变化的(不仅是在图片中,在真实世界中大小也是变化的)。
  • 形变(Deformation:很多东西的形状并非一成不变,会有很大变化。
  • 遮挡(Occlusion:目标物体可能被挡住。有时候只有物体的一小部分(可以小到几个像素)是可见的。
  • 光照条件(Illumination conditions:在像素层面上,光照的影响非常大。
  • 背景干扰(Background clutter:物体可能混入背景之中,使之难以被辨认。
  • 类内差异(Intra-class variation:一类物体的个体之间的外形差异很大,比如椅子。这一类物体有许多不同的对象,每个都有自己的外形。
2.Nearest Neighbor 分类器和 K-Nearest Neighbor分类器的 原理公式 以及区别,联系
KNN是寻找K个相似的图片的标签。分别投票,选出最相似的标签。
L1  L2 
3.交叉验证的到 htperparameter的原理:
数据只有1000个,我们分成5分,用其中4分训练,剩下的一份来验证,如此循环。
4.NN分类器的优缺点
优点:易于理解,实现简单,测试耗费时间长。因为要与测试的每一张图片进行比较。 将所有的数据都存储起来,过于浪费资源。
5.基于 4的优缺点,我们提出了使用Score function 和 Loss function 来进行图像分类,将图像分类变成一个最优化问题,这是如何实现的?
关键点 :将图像到标签值的参数化映射,也就是 Score function ,一个线性得分函数:
\displaystyle f(x_i,W,b)=Wx_i+b
6.小知识点:将权重和偏置参数合并的技术:

 

转载于:https://www.cnblogs.com/xialuobo/p/5879172.html

你可能感兴趣的文章
一个整数的各种带分数表示
查看>>
思考程序
查看>>
RapidXml用法
查看>>
spring加载过程中jar包加载不了,解决方法
查看>>
[原]Unity3D深入浅出 - 摄像机组件(Camera)
查看>>
诡异的DataTime.Now.ToString()
查看>>
hdu 4901
查看>>
jdk环境变量配置
查看>>
关于添加图片到svg中,rails下使用js, 用parseFloat来调整force.on时的位置
查看>>
5个用于移动开发的最流行数据库
查看>>
网页动态添加的内容,没有触发事件
查看>>
SQL Server 内存压力解决方案
查看>>
SVD神秘值分解
查看>>
项目中遇到的IE8浏览器访问页面过慢问题
查看>>
window.location.href的使用方法
查看>>
j2ee指导型框架或示例
查看>>
CSerialIO--串口控件
查看>>
[詹兴致矩阵论习题参考解答]习题2.1
查看>>
#import与@class的区别
查看>>
栈的存储结构和常见操作(c 语言实现)
查看>>