CNN与RNN有什么不同?
狗还是小马?
下面是一个图像识别角色的例子。人类在看到大丹犬时,知道尽管它体型很大,但它仍然是一条狗。计算机则只看数据。那么计算机如何知道这是一条大丹犬而不是小马?由于像素的数值表示可以通过CNN的多个层进行处理。许多大丹犬的特征可以通过这种方式识别出来,最终得出这是一条狗的答案。
现在让我们来深入探查CNN,从更多的技术层面了解它的本质。
CNN由输入层(例如由像素数表示的图像)、一个或多个隐含层以及输出层构成。
这些数学运算层会帮助计算机一次一点点地定义图像细节,并最终(可能性很大)识别特定对象、动物或其他任何目标。不过,失误经常在所难免,尤其是在训练初期。
卷积层:
在数学中,卷积是一种分组函数。就CNN而言,卷积发生在两个矩阵(以列和行排列的矩形数组)之间,它可以形成第三个矩阵作为输出。
CNN在卷积层中使用这些卷积来筛选输入数据并查找信息。
在CNN中,卷积层将完成大部分计算繁重的工作。它起着数学过滤器的作用,帮助计算机查找图像边缘、明暗区、颜色及其他细节(例如高度、宽度和深度)。
通常,一张图像上会应用多种卷积层过滤器。
池化层:池化层通常夹在卷积层之间。它们将用于缩减卷积层所创建的表示的大小,同时减少内存需求,从而实现更多的卷积层。
归一化层:归一化是一项用于改进神经网络性能和稳定性的技术。它通过将所有输入都转换为均值为0且方差为1,从而使每个层的输入更便于管理。可以将其视为数据的规范化调整。
全连接层:全连接层用于将一层中的各个神经元连接到另一层中的所有神经元。
有关更深入的技术说明,可参阅NVIDIA开发者网站上的 CNN 页面。
CNN非常适合计算机视觉应用,但在提供足够数据的情况下,还可将其用于视频、语音、音乐和文本等多个领域。
CNN可以在这些隐含层中使用一系列过滤器(或神经元),从而优化图像识别效率。CNN 被称为“前馈”神经网络,因为信息是从一层馈送至下一层。
另一方面,RNN与传统人工神经网络和CNN共用大部分相同的架构,不同之处在于RNN具有可用作反馈环路的存储器。就像人类大脑一样(尤其是在谈话时),侧重点被放在了信息的新近度上,以求对后面的话做出预测。
因此,RNN适合预测一系列单词的后续内容。此外,RNN还可馈入不同长度的数据序列,而CNN则采用固定的输入数据。
RNN简史
RNN也诞生于20世纪80年代。1982年,John Hopfield发明了Hopfield网络,即RNN的雏形。
而RNN所使用的所谓长短期记忆 (LSTM) 网络则是由Sepp Hochreiter和Jürgen Schmidhuber于1997年发明的。2007年前后,LSTM在语音识别方面取得了飞跃式发展。
2009年,RNN在手写模式识别大赛中获胜。2014年,百度搜索引擎突破了Switchboard Hub5’00语音识别标准,堪称新的里程碑。
RNN解读
午餐吃什么?
RNN是一个带有活动数据存储器的神经网络。它可以应用于一系列数据,帮助猜测接下来会发生什么。
借助RNN,有些层的输出会被反馈给前一层的输入,从而构成反馈环路。
以下是一个简单RNN的典型例子。自助餐厅对每周同一天供应的菜品有严格的时间表,RNN的目的是追踪供应主菜的日期。不妨设想如下:周一为汉堡,周二为炸玉米饼,周三为披萨,周四为寿司,周五则为意大利面。
对于RNN而言,如果将“寿司”(输出)反馈至网络以确定周五的菜品,那么RNN就会知道序列中的下一个主菜是意大利面(因为它知道会有一个顺序,而周四的菜品刚刚完成,因此接下来就应该是周五的菜品)。
另一个示例是句子:我刚跑了10公里,需要来一杯____。人类可以根据过去的经验来猜想如何填空。得益于RNN的记忆功能,它可以预测接下来会发生什么,因为它对类似这样以“水”结束的句子已有足够的训练记忆,完全可以做出解答。
RNN的应用不仅限于自然语言处理和语音识别。它们还可用于语言翻译、股票预测和算法交易。
现在人们在用的神经图灵机 (NTM) 也是可以访问外部存储器的RNN。
最后一点,所谓的双向RNN其实是获取一个输入向量并在两个RNN上进行训练。其中一个在常规RNN输入序列上接受训练,而另一个则逆序接受训练。接下来,两个RNN的输出会进行连结或组合。
如今,CNN和RNN已经让应用程序、网络和机器远远超越了视觉和语音能力。没有这两个AI主力军,我们的机器就会无聊之至。
-
汽车测试网V课堂
-
微信公众号
-
汽车测试网手机站
编辑推荐
最新资讯
-
法规标准-ADAS法规需求分解
2025-01-03 16:18
-
不限车辆数量,但需提交数据!美国NHTSA提
2025-01-03 16:17
-
TSP™工具包软件的应用说明
2025-01-03 12:41
-
新能源汽车“国补”空窗期,国家队北汽极狐
2025-01-03 10:16
-
一汽-大众荣获ISO 26262 ASIL-D功能安全流
2025-01-03 10:15