维也纳技术大学的研究人员研究了人工智能如何对图像进行分类。研究结果显示,人工智能与自然界的视觉系统有着惊人的相似之处。
如何教会机器识别图像中的物体?近年来,该领域取得了巨大进步。例如,借助神经网络,可以非常高的成功率将动物图像分配给相应的物种。这是通过借助许多样本图像训练神经网络来实现的。网络会逐步调整,直到最终尽可能准确地给出正确答案。
然而,通常情况下,在这个过程中会形成哪些结构以及在神经网络中会发展出哪些机制最终实现目标仍然是个谜。
由拉杜·格罗苏(RaduGrosu)教授领导的维也纳技术大学团队和由丹尼拉·鲁斯(DanielaRus)教授领导的麻省理工学院团队现已对这一问题进行了研究,并得出了一些惊人的结果:人工神经网络中形成的结构与动物或人类神经系统中的结构有着惊人的相似之处。
该团队于5月在维也纳举行的国际学习表征会议(ICLR2024)上展示了他们的研究成果。
“我们使用所谓的卷积神经网络。这些是人工神经网络,通常用于处理图像数据,”维也纳技术大学计算机工程研究所的ZahraBabaiee说道。她是这篇论文的第一作者,部分工作与麻省理工学院的DanielaRus合作完成,部分工作与维也纳技术大学的PeymanM.Kiasari和RaduGrosu合作完成。
这些网络的设计灵感来自我们眼睛和大脑中的生物神经网络。在那里,视觉印象由多层神经元处理。某些神经元变得活跃,例如,当它们被眼睛中的光信号激活时,它们会将信号传输到其后层的神经元。
在人工神经网络中,这一原理在计算机上以数字方式模拟:所需输入(例如数字图像)逐像素传输到人工神经网络的第一层。第一层神经元的活动仅取决于呈现给它们的是较亮还是较暗的像素。
然后,第一层中神经元的这些活动值用于确定下一层中神经元的活动:后续层中的每个神经元根据非常具体的单独模式(根据非常具体的公式)组合来自第一层的信号,然后得出一个值,该值随后用于确定下一层中神经元的活动。
与生物神经网络惊人的相似
“在卷积神经网络中,并非一层中的所有神经元都会对下一层中的每个神经元发挥作用,”ZahraBabaiee解释道。“即使在大脑中,也并非一层中的每个神经元都毫无例外地与前一层的所有神经元相连,而只是与特定区域中的相邻神经元相连。”
因此,在卷积神经网络中,所谓的“过滤器”用于决定哪些神经元对特定的后续神经元有影响,哪些没有影响。这些过滤器不是预先确定的,而是在神经网络训练过程中自动形成的。
“在用数千张图像训练网络时,这些过滤器和其他参数也在不断调整。算法会尝试前一层神经元的哪种权重能产生最佳结果,直到图像被分配到具有最高可靠性的正确类别,”ZahraBabaiee说道。“算法会自动执行此操作,我们无法直接影响它。”
然而,在训练结束时,可以分析哪些过滤器以这种方式发展。这揭示了有趣的模式:过滤器并非完全随机的形式,而是分为几个简单的类别。