精能集团有限公司两学一做网站,synology做网站,平面广告设计公司,营销策划方案1000例大家好啊#xff0c;我是董董灿。
深度学习算法中#xff0c;尤其是计算机视觉#xff0c;卷积是无论如何都绕不过去的槛。
初学者看到这个算法后#xff0c;很多是知其然不知其所以然#xff0c;甚至不知道这个算法是做什么的#xff0c;或者很疑惑#xff0c;为什么…大家好啊我是董董灿。
深度学习算法中尤其是计算机视觉卷积是无论如何都绕不过去的槛。
初学者看到这个算法后很多是知其然不知其所以然甚至不知道这个算法是做什么的或者很疑惑为什么在处理图像任务的神经网络中需要卷积算法 1、 为什么需要卷积
在说卷积之前先说一说一个神经网络(或者叫一个AI模型)是如何完成一张图片的推理的。
你肯定听说过大名鼎鼎的阿尔法狗大战柯洁的故事但是你有没有想过一个问题阿尔法狗学会了下棋但是它下棋的记忆到什么样的存在什么地方呢
高中生物老师教过我们人脑中有大量的脑神经元。每个脑神经元都可以看做是一个小的记忆体神经元之间通过树突连接起来整个大脑的神经元可以说是一张十分复杂的网络。
人脑处理信息就是利用这个复杂的网络处理信息并最终得到一个结果。通过神经元网络我们才能知道眼睛看到的是一只猫还是是一只狗。
稍微简化一下大脑神经元的复杂结构成如下的网络。 每个黑点代表一个神经元脑细胞每个神经元都有自己负责记忆的东西。
当我们看到一张画着猫的图片的时候图片信息通过视神经传给大脑神经元于是信息到达了最左边一排竖着的黑点神经元。 神经元的激活
假如一个黑点(神经元)之前见过猫那么这个黑点就会把信息往后传此时神经元处于激活状态。
假如一个黑点从来没见过猫那么这个黑点(神经元)就啥也不知道啥也不做此时神经元处于静止状态。
一张画着猫的图片的信息就这样一层一层地通过“见过猫且确信它是一只猫的”神经元往后传递直到在最后输出一个结果。
这是一只猫。 这个过程叫做大脑的推理。
整个推理过程你应该注意到了一件事所有的黑点都可能是有记忆的只不过记得东西各有不同有的认识猫有的认识狗就像下面这样。 所有认识猫的神经元都会让信息通过其他不认识猫的神经元都静止了。但是只要信息能传到最后人脑最终就可以得出一个结论这就是一只猫。
那神经元的这些记忆是怎么获取的呢
训练人们在日常生活中不断地训练大脑时刻观察着周围的事物见得多了就会了。 训练获取记忆
人工智能计算机是怎么模拟这个记忆过程呢
答案很简单计算机只会计算那就让它计算好了。
如果某个黑点认识猫有什么办法可以把“这是一只猫”这一信息传递到后面呢乘以1任何数乘以1都是它自己一只猫乘以1也还是他自己。
如果某个黑点压根没见过猫有什么办法可以什么都不做呢乘以0任何数乘以0都是0信息也就没了一只猫乘以零猫也就没了。
于是在深度学习的网络中每个黑点(神经元)都有一个与之对应的数字实际的网络中不是0或者1这样简单的数字而是一些复杂的数字这里仅仅是为了说明这些数字在深度学习中我们称之为权值。 神经元通过权值的加权计算来判断是否让某一信息经过神经元到达下一层。
权值乘以输入的信息猫然后经过激活函数去激活类似于人脑神经元的激活。
如果能成功激活那么信息就往下传。
如果没有成功激活信息就在此丢失。
当然神经网络中的权值不是简单的0或1所以经过激活函数计算出来的只是一个概率值也就是说黑点神经元觉得它是一只猫的概率。最终如果得到95%的概率觉的它是一只猫那基本就是一只猫。
人脑看多了就认识猫了同样AI被训练的“看”多了也会逐渐“认识”猫了。
AI的权值就是这么被训练出来的
说到这就说会今天的主角——卷积算法之所以重要就是因为这个算法存在一个天然的记忆体或者是权值矩阵那就是卷积核。 2、卷积算法 深度学习中的卷积算法模拟的就是人眼看物体的过程。 上图是深度学习中卷积的示意图还记得之前说过的么图片是由像素组成的(查看要学计算机视觉先了解图像和像素)。
示意图下方的 4x4 的像素方格就是卷积算法需要处理的图片(类比于人眼观看的图片)。
示意图上方的 2x2 的像素方格就是卷积算法的输出(类比于人眼看完一张图片后的结果信息)。
4x4的方格上移动的灰色阴影那个3x3的像素方格就是卷积核可以把它理解为人眼此时聚焦看到的区域称之为感受野人眼的视野只不过这个示意图中每次看到的都是一个3x3的像素方格
而卷积过程就是用一个3x3的卷积核去逐步扫描图片横着扫完竖着扫每扫一次就将逐个像素点的值相乘然后加一起得到一个输出就像下面这样 再换个更直观的角度看一眼。 卷积就是这么简单的过程。
我们可以通过调整卷积核的大小比如把上图3x3的卷积核扩大到5x5来控制 “人眼” 看到的图片范围从而获取到不同尺度下的图片信息。
比如在一些检测车道线的神经网络中由于车道线是长实线车道线的存在趋近于长方形因此在这类神经网络中很多卷积核被设计成1x5或1x7的卷积核用来更好的识别车道线的形状。
当然在不同图像处理任务中会设计不同大小的卷积核以适应不同的场景序需求但万变不离其宗卷积的计算就是一些模拟的人眼看物体扫描像素点的过程。
说到这大概对卷积这一算法有一个初步印象了吧。