您当前的位置:首页 > 新闻 > 焦点

为什么我们的神经网络需要激活函数

时间:2020-07-30 11:23:24  来源:  作者:

如果你正在读这篇文章,那么很可能你已经知道什么是神经网络,什么是激活函数,但是,一些关于机器学习的入门课程并不能很清楚地说明,为什么我们需要这些激活函数。我们需要它们吗?没有它们,神经网络还能工作吗?

为什么我们的神经网络需要激活函数

 

首先让我们回顾一下关于神经网络的一些事情。它们通常被可视化地表示为一个类似图表的结构,如下图所示:

为什么我们的神经网络需要激活函数

 

如上图所示,神经网络有3层:输入层、隐藏层、输出层,共3、4、2个神经元。输入层的节点数量与数据集的特性数量相同。对于隐藏层,您可以自由选择需要多少节点,并且可以使用多个隐藏层。

网络中的每个神经元,除了那些在输入层的神经元,可以被认为是一个线性分类器,它将前一层神经元的所有输出作为输入,并计算这些输出加上一个偏置项的加权和。然后,下一层的神经元将前一层线性分类器计算的值作为输入,然后计算这些值的加权和,依此类推。我们希望,通过以这种方式结合线性分类器,我们可以构建更复杂的分类器,可以代表我们的数据中的非线性模式。

让我们看看下面的例子数据集:

为什么我们的神经网络需要激活函数

 

这个数据集不是线性可分的,我们不能将一个类从另一个通过一条线分开。但我们可以通过使用两条线作为决策边界来实现这种分离。

为什么我们的神经网络需要激活函数

 

所以,我们可能认为两个中间神经元可以完成这个工作。这两个神经元将学习上图中的两条分离线。然后我们需要一个输出神经元它将之前的两个神经元作为输入,这样它就能正确地进行分类。

为什么我们的神经网络需要激活函数

 

对于最后一个做正确分类的神经元,它需要n1和n2隐藏神经元的输出是线性可分的,如果我们把它们画在一个二维平面上。上面画的两条线有方程:

为什么我们的神经网络需要激活函数

 

这意味着这两个隐藏的神经元正在计算输入x1和x2的如下线性组合:

为什么我们的神经网络需要激活函数

 

我们画出n1和n2看看它们是否有用。

为什么我们的神经网络需要激活函数

 

我们对我们的小神经网络感到失望。n1和n2的输出仍然不是线性可分的,因此输出神经元不能正确分类。那么,问题是什么呢?

问题是,任何线性函数的线性组合仍然是线性的,在一张纸上证明它是正确的并不难。这一事实的证据在本文的结尾。所以,不管我们用了多少层或多少神经元,按照我们目前的方式,我们的神经网络仍然只是一个线性分类器。

我们需要更多的东西。我们需要将每个神经元计算出的加权和传递给一个非线性函数,然后将这个函数的输出看作那个神经元的输出。这些函数称为激活函数,它们在允许神经网络学习数据中的复杂模式时非常重要。

[1] 已经证明,具有2层(输入层除外)和非线性激活函数的神经网络,只要在这些层中有足够多的神经元,就可以近似任何函数。那么,如果只有两层就够了,为什么人们现在还在使用更深层次的网络呢?嗯,仅仅因为这两层网络"能够"学习任何东西,这并不意味着它们很容易优化。在实践中,如果我们的网络产能过剩,他们就会给我们提供足够好的解决方案,即使他们没有尽可能地优化。

还有更多种类的激活函数,我们想在上面的示例中使用其中的两种。它们分别是ReLU(直线单元)和tanh(双曲正切),如下图所示。

为什么我们的神经网络需要激活函数

 


为什么我们的神经网络需要激活函数

 


为什么我们的神经网络需要激活函数

 


为什么我们的神经网络需要激活函数

 

如果我们在示例中使用ReLU激活,将会发生什么?下图是应用ReLU激活后n1和n2神经元的输出。

为什么我们的神经网络需要激活函数

 

现在,我们的这两类点可以用直线分开,这样输出神经元就可以正确地对它们进行分类。

为什么我们的神经网络需要激活函数

 

如果我们使用tanh激活,也会发生类似的事情,但这次我们的点之间的差距更大。

为什么我们的神经网络需要激活函数

 

同样,输出神经元可以正确地分类这些点。

为什么我们的神经网络需要激活函数

 

这里有一个简单的数学证明,证明任何线性函数的线性组合仍然是线性的:

为什么我们的神经网络需要激活函数

 

其中a0, a1,…,an是不依赖于输入x1,…,xn的常数。

我希望这篇文章对你有用,谢谢阅读!

参考

[1] Cybenko, G.V. (2006). "Approximation by Superpositions of a Sigmoidal function". In van Schuppen, Jan H. (ed.). Mathematics of Control, Signals, and Systems. Springer International. pp. 303–314.

作者:Dorian Lazar

deephub翻译组



Tags:神经网络   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
SimpleAI.人工智能、机器学习、深度学习还是遥不可及?来这里看看吧~ 从基本的概念、原理、公式,到用生动形象的例子去理解,到动手做实验去感知,到著名案例的学习,到用所学来实现...【详细内容】
2021-10-19  Tags: 神经网络  点击:(47)  评论:(0)  加入收藏
MNIST 这里就不多展开了,我们上几期的文章都是使用此数据集进行的分享。手写字母识别EMNIST数据集Extended MNIST (EMNIST), 因为 MNIST 被大家熟知,所以这里就推出了 EMNIST...【详细内容】
2021-09-08  Tags: 神经网络  点击:(182)  评论:(0)  加入收藏
理解什么是人工智能,以及机器学习和深度学习如何影响它,是一种不同凡响的体验。在 Mate Labs 我们有一群自学有成的工程师,希望本文能够分享一些学习的经验和捷径,帮助机器学习...【详细内容】
2021-06-09  Tags: 神经网络  点击:(128)  评论:(0)  加入收藏
资料来源:getwallpapers.com 深度学习是机器学习中重要分支之一。它的目的是教会计算机做那些对于人类来说相当自然的事情。深度学习也是无人驾驶汽车背后的一项关键性技术,...【详细内容】
2021-04-13  Tags: 神经网络  点击:(168)  评论:(0)  加入收藏
私有虚拟网络(VPN)是在公用网络基础之上建立的私有加密通信隧道网络,企业对于自管辖网络中个人使用VPN软件行为具有监管责任,但技术上却很难识别VPN的加密与通信方式,因此利用人工智能(AI)领域的神经网络技术从网络流量中识...【详细内容】
2021-01-07  Tags: 神经网络  点击:(193)  评论:(0)  加入收藏
深层神经网络的模型概括,过度拟合和正则化方法的挑战> Source 在完成了与神经网络有关的多个AI项目之后,我意识到模型的概括能力对于AI项目的成功至关重要。 我想写这篇文章来...【详细内容】
2020-10-30  Tags: 神经网络  点击:(101)  评论:(0)  加入收藏
本文最初发表于 Towards Data Science 博客,经原作者 Andre Ye 授权,InfoQ 中文站翻译并分享。卷积神经网络(Convolutional Nerual Network,CNN)构成了图像识别的基础,这无疑是深...【详细内容】
2020-10-16  Tags: 神经网络  点击:(115)  评论:(0)  加入收藏
本报告讨论了非常厉害模型优化技术 —— 知识蒸馏,并给大家过了一遍相关的TensorFlow的代码。...【详细内容】
2020-09-25  Tags: 神经网络  点击:(92)  评论:(0)  加入收藏
算法算法从1950年代的早期研究开始,机器学习的所有工作似乎都随着神经网络的创建而积累起来。 从逻辑回归到支持向量机,相继提出了新算法之后的算法,但是从字面上看,神经网络是...【详细内容】
2020-09-17  Tags: 神经网络  点击:(90)  评论:(0)  加入收藏
卷积神经网络(CNN)广泛应用于深度学习和计算机视觉算法中。虽然很多基于CNN的算法符合行业标准,可以嵌入到商业产品中,但是标准的CNN算法仍然有局限性,在很多方面还可以改进。这篇文章讨论了语义分割和编码器-解码器架构...【详细内容】
2020-09-17  Tags: 神经网络  点击:(93)  评论:(0)  加入收藏
▌简易百科推荐
今天是平安夜,又称圣诞夜,即圣诞前夕,表示圣诞日的开始。关于圣诞节的几个冷知识你不一定知道。1、Jingle Bells不是圣诞节的歌“叮叮当~叮叮当~铃儿响叮当”,其实《Jingle Bell...【详细内容】
2021-12-24  夜航船船夫    Tags:平安夜   点击:(18)  评论:(0)  加入收藏
编者按:眼下,元旦和春节假期邻近,很多人开始担心,今年过节能回家吗?对此,昨日的国务院联防联控机制发布会上,国家卫健委相关负责人给出了答案。 资料来源:国务院联防联控机制发布会...【详细内容】
2021-12-20  人民网    Tags:国家卫健委   点击:(11)  评论:(0)  加入收藏
个税抵扣事关百姓“钱袋子”。近日,个人所得税APP首页热点专题版块上新“下一年度专项附加扣除开始确认”,税务部门喊话纳税人确认相关扣除信息。中国财政学会绩效管理专委会...【详细内容】
2021-12-14    证券日报  Tags:个税抵扣   点击:(12)  评论:(0)  加入收藏
钱江晚报·小时新闻记者 黄伟芬今天(12月7日)下午,杭州市召开疫情防控工作新闻发布会,通报两例新冠肺炎轻型确诊病例有关情况。萧山区北干街道龙湖春江天玺17幢列为中风险...【详细内容】
2021-12-08    钱江晚报  Tags:行程码   点击:(15)  评论:(0)  加入收藏
你的行程码,是不是带*了?行程码带星是什么意思?城市名称标有*(星号),表示您在过去14天访问过的城市中目前存在中等或高风险区域,但这并不意味着您实际访问过这些中等和高风险区域。...【详细内容】
2021-12-08    浙江日报  Tags:行程码   点击:(12)  评论:(0)  加入收藏
每经记者:李玉雯 每经编辑:段炼,廖丹近日,“明年3月1日起,微信、支付宝个人收款码不能用于经营收款”冲上热搜,在各大社交平台刷屏。《每日经济新闻》记者了解到,这一消息源自央行...【详细内容】
2021-12-03  每日经济新闻    Tags:商户码   点击:(11)  评论:(0)  加入收藏
针对新冠病毒奥密克戎变异株,国家卫生健康委组织中国疾控中心专家就有关问题进行了解答:奥密克戎变异株的发现和流行情况2021年11月9日,南非首次从病例样本中检测到一种新冠病...【详细内容】
2021-12-01    新华社  Tags:奥密克戎   点击:(17)  评论:(0)  加入收藏
自11月17日起,北京市正式实施从严从紧做好进出京管理的措施,迄今已近两周时间。按照新规定,进(返)京人员须持48小时内核酸检测阴性证明和“北京健康宝”绿码,环京通勤人员每次持14...【详细内容】
2021-11-30    新京报  Tags:出京政策   点击:(31)  评论:(0)  加入收藏
(央视财经《天下财经》)在抗击新冠疫情的战斗中,我国的科研工作者始终在与时间赛跑。最新消息显示,我国新冠特效药终于有了“时间表”,其中一款抗体组合药物最快有望于年底前获批...【详细内容】
2021-11-17    央视财经  Tags:新冠特效药   点击:(17)  评论:(0)  加入收藏
央视网消息:国家卫生健康委11月15日发布新冠疫苗加强免疫接种相关问答。问答指出,预防新冠肺炎最好的办法是接种疫苗,但接种疫苗一段时间后,疫苗对部分人员的保护效果可能会减弱...【详细内容】
2021-11-16    央广网  Tags:新冠疫苗   点击:(29)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条