你所在的位置: 首页 > 正文

不用挨个数数,DNN也能「一眼看出」目标数量

2019-07-12 点击:1090
金百利在线注册

DNN还可以“一目了然”查看没有单个数字的目标数量

机器整理的核心

机器心脏编辑器

在图像分类中,目标的“定量意义”也自发地反映在深度神经网络中。

计算机可以完成许多数字任务。当人们共享餐馆账单时,人们发现很难计算,但现代计算机只需一秒就能完成数百万次计算。然而,人类具有直观的数量感,可以帮助我们首先创建计算机。

但与计算机不同的是,当你看到四只猫,四个苹果和数字符号“4”时,人类可以找到共性 - 抽象概念“4”没有计算。这显示了人类思维与机器之间的差异,并解释了为什么人类没有用自己的智慧开发人工智能。

那么,机器还能有这个抽象的“数量”吗?最近发表在Science Advances上的一篇论文似乎回答了这个问题。来自德国蒂宾根大学的研究人员发现,人工智能可以自然形成与人类相似的定量感。

论文:数字检测器自发地出现在为视觉对象识别而设计的深度神经网络中

链接到论文:

在计算计算机时,人们必须明确指定他们想要计算的内容。人们需要分配一部分内存来维护计数器,因此您可以在添加要记录的项目之前将其设置为零。这意味着计算机可以计算时间(电子时钟信号),文本(如果存储在计算机存储器中)和数字图像中的目标。

计算数字图像中的目标很困难,因为人们在计算它们之前必须告诉计算机它们是什么。但是这些目标并不总是相同的 - 照明,位置和姿势的变化以及各个样本之间的结构差异都会产生影响。通过提取图像的高级特征并创建目标的统计图像来实现用于检测图像中的对象的所有有效计算方法。这是一种学习方法。

因此,除了识别已识别的类别或目标位置外,人工神经网络能否学习“数量感”?在德国蒂宾根大学的这项研究中,研究人员将网络元素调整为抽象数量,并将“真实神经元”的活动与“数量”进行比较。研究人员最终表明,在目标分类任务中,定量选择性自发地出现在深层神经网络中。

如何形成“数量感”

在这项新研究中,经过训练以进行简单视觉目标检测的深度神经?缱匀恍纬闪苏庵质扛小Q芯咳嗽狈⑾郑缰械囊桓鎏囟ǖピ蝗弧暗髡蔽橄笫郑拖翊竽灾锌赡芟煊Φ恼媸瞪窬谎M缫馐兜剿母銎还耐枷裼胨闹幻ǖ耐枷窭嗨疲蛭嵌及?4”。

5a9bd5d92c8b40ceba88d734741accd4.jpeg

一种识别特定点数的人工神经元,其输出单元对数量有不同的反馈(AndreasNieder)

这项研究真正令人兴奋的是它表明我们目前的学习原则是非常基础的。人类和动物思维的一些最先进的方面与世界的结构和我们的视觉体验密切相关。

具体而言,研究人员使用了分层卷积神经网络(HCNN),这是一类生物启发模型,最近在计算机视觉应用中取得了巨大成功。与大脑类似,这些模型包括几层前馈和视网膜拓扑结构,其中包含模拟不同类型视觉神经元的单个网络元素。训练程序自动确定每个单元中每个特征的选择性,以最大化给定任务的网络性能。

研究人员建立了这样一个网络,并在一个与数量无关的视觉目标识别任务中训练它,以探索上述“定量意义”是否会自然发生以及如何产生。

3f5b10af88de46e7a6222aca704414e4.jpeg

图1:用于目标检测的HCNN。 (A)HCNN的简化架构。 (B)使用由其他节肢动物训练的网络成功分类狼蛛的一个例子。

研究人员训练了一个深度神经网络来对自然图像中的目标进行分类。为了探索针对自然图像目标分类训练的网络是否能够自发地评估点分布中的项目数量,研究人员观察了不同的量是否会在网络元素中产生不同的激活值。

实验结果

研究人员将336张图像导入网络并记录最后一层的反馈。使用双向方差分析(ANOVA)并将数量和刺激设置为因子,研究者可以检测对项目数量具有选择性的网络元素(P <0.01),但对刺激或相互作用没有显着影响。

在最后一层中的37,632个网络元素中,3601(9.6%)是数字选择性网络元素。如下面的图2B所示,量选择单元的激活值呈现清晰的调谐模式,但基本上与真实神经元相同(图2C):每个网络元素呈现显示值的最大值。最敏感的响应是优选的定量表示,并且随着呈现量偏离优选数量,该响应依次减少。

分布的优选定量表示覆盖整个呈现量范围(1到30),更多网络元素优选小于最大值的数量(图2D),并且在真实神经元中观察到类似的分布(图.2E)。

09261a9c47cc47d3b1c491e074fc8c31.jpeg

图2:HCNN中出现的数字调整单元。

如果数字选择网络元素类似于大脑中的数字选择神经元,则前者应显示相同的调整属性。因此,研究人员计算了数量选择单元的平均激活值(具有相同的优选数量)并将它们归一化到0-1的激活范围,以创建混合网络调谐曲线(图3)。

a5a6064993e7478e9253d59129ce9aca.jpeg

图3:值选择网络元素的调整曲线。

7d1f9cb3d37246bc819f5adb24291cbc.jpeg

图4:数字选择网络元件的调谐特性。 (A)左:网元的平均调谐曲线更可能以线性标度绘制每个值。右图:以对数刻度绘制的相同调整曲线。 (B)使用不同尺度的调谐曲线拟合高斯函数,以及平均拟合度。 (C)选择不同比例数的网络元素,每个调整曲线符合高斯函数的标准偏差。

最后,与处理数字的其他网络模型相比,HCNN的主要进步是其体系结构和功能与视觉系统非常相似,例如具有可接受域和侧面抑制的网络元素的层次结构,形成视觉特征。拓扑组织结构图。这些研究结果表明,数量感确实自发地产生了基于视觉系统的内在机制。

参考链接:

看看更多

日期归档
金百利注册 版权所有© www.techspecters.com 技术支持:金百利注册 | 网站地图