激活函数,又称为阶跃函数,即当输入的数值达到某个标准时,这个函数的返回值会出现一个明显的变化。部分激活函数如下图所示: [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RkxBj3Rm-1587955391478)(https://i.loli.net/2020/04/18/dN6TKbB2RGvnzoO.png)]
在此次视频中,选用的便是第一个激活函数来进行学习判断 donuts or bagels,由函数曲线的特点可以发现,随着输入值达到某一点之后,函数会产生一个小的“阶跃”,这即是机器的神经网络被激活了,并给出了反馈。
紧接着,传感器接受数据,与之各自的权重处理后,传入数据,经过处理后,如果大于偏差(biase),神经元激活的临界值(阀值/threshold),则输出1,否则输出0.如下图所示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Gwy297lv-1587955391485)(https://i.loli.net/2020/04/18/QfwAJGE7TWea5hl.png)]
标红的地方即为阀门。
此外,还可以将阀门想象成一个分界线来进行理解,如下图所示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bZcZcQpI-1587955391489)(https://i.loli.net/2020/04/18/LyUcp3BP9tnzTRM.png)]
donuts 和 bagels 的质量和直径可以想象成坐标轴,坐标轴上的一条线,可以看成是阀门,线的上端是 bagels,下端是 donuts,这即是区别 bagels 和 donuts 的一个很形象的例子。
当然,不少同学应该都能看出来,这个阀值存在个很大的问题,即如果光凭质量和直径来区别两者的话,如果我的donuts直径比bagels大呢?这样不就会大大降低它的一个准确率吗?
没错,是的。所以,在选取特征时,我们要注意选取能表达事物本质属性的特征,来作为我们神经网络的输入值,借此来加强网络的可靠性和准确率。
当然,除了选取好的特征,我们还需要设置和更新特征的权重,来实现更高的准确率,这个权重的更新过程依赖于一个叫做“Update Rule”(更新方程?)。
在本例中,由于结论只能有预测正确或错误两种,因此它的权重的更新会比较简单点。
如果预测正确,则会产生类似“0”的数值加到权重Weights上,这时权重未发生变化。但如果预测错误,则会产生一个很小的正数或者负数加到权重上,这样就起到了更新权重的作用。
更新后的权重对阀值得影响如下图所示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xfsbyU00-1587955391495)(https://i.loli.net/2020/04/18/a1DpdQoe29sEl8V.png)]
可以发现,此时线下为甜甜圈得区分区域。
此外,我们可以通过混淆矩阵来看它得总体准确率,如下图所示:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-waeaCeiv-1587955391502)(https://i.loli.net/2020/04/18/reRChYbLWEZ9jyk.png)]
这个涉及到一点专业得知识,我放个链接给大家,大家自己看看。
当然,真正说明问题得还的是混淆矩阵计算得出的:
Precision(精准度) & Recall(召回率)
在说明以上概念之前,我们得先确定我们的重点,比如这个视频中的实验重点是关注预测为甜甜圈的结果,所以这里的精准度即是指预测它为甜甜圈的精确度是多少。
按照视频里来说,就是,当程序告诉你它找到什么东西时,你该有多信任它。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3jckqF2K-1587955391504)(https://i.loli.net/2020/04/18/UiVwG4DvI657YAu.png)]
从图上看,agent在说donuts的情况下(10次),有8次是对的,那么 donuts的准确率即为80%。
而召回率即是,在预测为donuts的情况下,它有多大可能是donuts。
按照视频里来讲,即是agent能找到多少你要的东西
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-CsxnEc1t-1587955391510)(https://i.loli.net/2020/04/18/oqpchMNbx6IaT78.png)]
可以发现,在总共说了25次donuts的情况下,agent说对的次数只有8次,那么它的召回率只有–32%。
在医学领域,预测恶性肿瘤中,我们往往最求的是召回率,而不是精确率,毕竟我们希望的是能够尽可能多的把恶性肿瘤给找到。
当然,以上结果都受到最初的特征选择的影响。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-LpbZjUII-1587955391513)(https://i.loli.net/2020/04/18/NsDKS6Vgy4qOjlF.png)]
那么今天的分享就到这里了,如果你觉得我讲的还可以,请在下面给我点个emoj吧!
如有问题,欢迎大家指正!