当前位置:首页|资讯|ChatGPT|人工智能

纽大发现婴儿天生拥有语言能力,甚至可能比ChatGPT更擅长学习

作者:DeepTech深科技发布时间:2024-02-02

原标题:纽大发现婴儿天生拥有语言能力,甚至可能比ChatGPT更擅长学习

人类婴儿甚至比最好的大型语言模型更善于学习。为了能够写出合格的英语,ChatGPT 必须在包含数百万甚至上万亿个单词的海量数据集上接受训练。

而孩子们只能接触到这些数据中的一小部分,但到三岁时他们就能以相当复杂的方式进行交流。

纽约大学的一组研究人员想知道人工智能是否能像婴儿一样学习。如果给人工智能模型一个小得多的数据集,利用一个学习说话的孩子所经历的景象和声音,人工智能模型能做什么?

事实证明,可以做的事很多。人工智能模型成功地将单词与它们所代表的物体相匹配。

纽约大学的计算认知科学家、该研究的作者布伦登·莱克(Brenden Lake)说:“即使在孩童阶段的这一短暂经历中,也有足够的数据表明它可以进行真正的单词学习。”

相关论文发表在 Science 上,不仅为婴儿如何学习提供了见解,还可能带来更好的人工智能模型。

(来源:WAI KEEN VONG)

在这项实验中,研究人员使用了一段时长为 61 小时的视频,这段视频来自于一名居住在澳大利亚阿德莱德附近的儿童所佩戴的头盔摄像头所拍摄。

这个孩子叫山姆(Sam),从六个月大到两岁生日过后的一年半时间里,他一直断断续续地戴着这个摄像头。

相机捕捉到了山姆在醒着的大约 1% 的时间里所看到和注意的东西。它记录了山姆的两只猫、他的父母、他的婴儿床和玩具、他的房子、他的饭菜等等。

莱克说:“这个数据集完全是独一无二的。”“这是我们了解单个儿童所能获得的信息的最佳窗口。”

为了训练这个模型,莱克和他的同事们使用了 60 万个视频帧,并与山姆的父母或房间里其他人在拍摄图像时所说的短语配对,总共有 37500 个“语句”。

有时,单词和物体是匹配的,有时则不匹配。例如,在一张剧照中,山姆看着一个形状分类器,一位家长说:“你喜欢绳子。”

在另一张照片中,大人的手覆盖在一些积木上,家长说:“你也想要这些积木。”

研究小组给了模型两条线索。当物体和单词出现在一起时,说明它们可能有联系。但当一个物体和一个单词没有同时出现时,就表明它们可能不匹配。

纽约大学计算认知科学家、该研究的作者韦肯·冯(Wai Keen Vong)说:“因此,我们在模型中出现了这种时而匹配、时而不匹配的情况。”

他说:“希望数据中有足够多的例子表明,当父母说‘球’这个词时,孩子看到的是球。”

将单词与它们所代表的对象进行匹配似乎是一项简单的任务,但事实并非如此。为了让你了解问题的难度,请想象一下一个有年幼孩子的家庭的客厅。

客厅里有所有普通的家具,但也有孩子们的杂物。地板上堆满了玩具。蜡笔散落在茶几上。窗台上放着零食杯,椅子上放着洗好的衣服。

如果一个蹒跚学步的孩子听到“球”这个词,它可能指的是球。但它也可以指任何其他玩具,或沙发、或一条裤子、或物体的形状、或颜色、或一天中的时间。莱克说:“任何单词都有无数种可能的含义。”

这个问题非常棘手,以至于一些发展心理学家认为,儿童必须天生了解语言是如何运作的,才能如此快速地学习语言。

美国斯基德莫尔大学的发展心理学家杰西·沙利文(Jess Sullivan)是收集山姆头盔摄像头数据的团队的一员,但没有参与这项新研究。

不过她说这项研究表明,即使没有这种天生的能力,也可以从很小的一组经验中学会语言的某些部分。她表示:“对我来说,这确实颠覆了我的世界观。”

但沙利文指出,能够将单词与它们所代表的物体相匹配,虽然是一个困难的学习问题,但这只是构成语言的一部分。还有一些规则制约着词语的组合。

你的狗可能知道单词“ball”或“walk”,但这并不意味着它能听懂英语。因此,婴儿与生俱来的语言能力可能并不局限于词汇量。

这可能会影响他们在世界上的活动方式,包括他们所关注的事物,或者他们对语言的反应。她说:“如果婴儿没有创建神经网络学习的数据集,我认为这项研究就不会成功。”

莱克和他的同事们下一步要做的是,努力找出使模型学习更接近儿童早期语言学习的方法。他说:“要让模型完全具备两岁儿童的能力,还有更多的工作要做。”

这可能意味着要提供更多的数据。莱克的孩子现在已经 18 个月大,她每周戴几个小时的头盔相机,同时她也是下一批提供这些数据的孩子中的一员。

或者,这个模型需要注意父母的目光,或者要对物体的坚固性有一定的感知,这是孩子们能直观掌握的。创建更像儿童一样学习的模型将有助于研究人员更好地理解人类的学习和发展。

人工智能模型如果能掌握人类学习语言的一些方法,学习效率可能会高出很多。

他们的行为可能更像人类,而不像语言学家诺姆·乔姆斯基(Noam Chomsky)和他的同事曾经描述的 ChatGPT 等大型语言模型那样,是“一个笨拙的模式匹配统计引擎”。

霍华德·施罗布(Howard Shrobe)在美国政府国防高级研究计划局管理该项目,该项目帮助资助了莱克的团队。他说:“人工智能系统仍然很脆弱,而且缺乏常识。”

但是,能像孩子一样学习的人工智能或许能够理解意义,也能应对新情况并从新经验中学习。我们的目标是让人工智能离人类智能更近一步。

支持:大义

运营/排版:何晨龙


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1