当前位置:首页|资讯|GPT-4

AI惨败!人类考92分的题,GPT-4仅得15分 | 科技周览

作者:返朴发布时间:2023-12-03

AI惨败!人类考92分的题,GPT-4仅得15分 | 科技周览

整理 | 周舒义

“抗癌神药”诱发癌症?FDA已展开调查

11月28日美国食品药品监督管理局(FDA)发布公告称,已收到报告显示,少数患者在接受嵌合抗原受体T细胞(CAR-T)疗法后新发T细胞淋巴瘤,正在调查CAR-T疗法可能诱发恶性肿瘤的“严重风险”。

CAR-T疗法被誉为“抗癌神药”。它对T细胞进行基因修饰,导入编码嵌合抗原受体(CAR)的基因,将其回输至患者体内,改造后的T细胞就能特异性靶向结合、杀伤肿瘤细胞。截至28日,FDA的FEARS数据库列出了12个上述新发恶性肿瘤的不良反应案例,一些患者因此住院或死亡。根据公告,目前在美国获批上市的6款靶向BCMA或CD19的CAR-T疗法均含潜在风险。其中Carvykti(靶向BCMA)、Tecartus和Yescarta(靶向CD19)已在我国获批上市。FDA表示,就批准用途而言,这些疗法总体来看仍然利大于弊,FDA正在评估采取监管行动的必要性。公告建议,接受这些疗法的患者和临床试验受试者应终身监测是否罹患新发恶性肿瘤。(FDA)

行星形成理论遭遇挑战:小恒星可以带动大行星

按照经典行星形成理论,低质量恒星周围很难形成大质量行星,最新研究挑战了这一认知。研究人员11月30日在Science发表论文,他们发现了一颗系外行星LHS-3154b,质量是地球的13倍,而其绕转的恒星LHS-3154质量仅为太阳的11%,行星-恒星质量比是地球-太阳的100多倍,远远超出当前理论预测的极限。

行星诞生于年轻恒星周围环绕的原行星盘,其间充满了气体和尘埃,原行星盘规模决定了诞生行星的质量大小。研究人员使用“宜居带行星探测器(HPF)”,通过视向速度法检测LHS-3154b造成的多普勒频移。观测显示,这颗行星非常靠近其主星,轨道周期仅3.7天。当前行星形成理论(核吸积理论和引力不稳定机制)无法解释此次观测到的高行星-恒星质量比(>3.5×10^(-3))。对核吸积的仿真计算表明,只有当原行星盘质量是预期10倍以上时,才能解释LHS-3154b的存在。(Science)

材料学迎革命性突破!AI预测220万种无机材料结构

从电子产品到光伏发电,现代生活中处处可见材料的身影。但合成新材料并不容易,需要长年累月的试错和大量埋头苦干的研究生。谷歌DeepMind团队11月30日在Nature发表两篇论文,有望改变这一现状:他们利用AI工具预测了220万种无机材料的结构和性质,其中有近40万种能稳定存在;研究团队还借助AI和机器人技术,实现了无机材料的全自动合成。

“材料计划(Materials Project)”是材料领域最全的在线开源数据库。研究人员使用来自Materials Project的48000条数据,训练名为“材料探索图形网络(Graph Networks for Materials Exploration,GNoME)”的深度学习模型,通过主动学习和多次迭代训练,GNoME成功预测了220万种可能的无机化合物,形成能计算表明,其中381000种材料可稳定存在。已有736种预测的材料通过独立实验验证了稳定性。测试表明,GNoME在预测稳定结构时成功率由此前研究的50%提高到80%;在预测成分时每100次实验的精确度由此前的1%提高到33%。

A-Lab使用AI驱动的机器人系统,加速新型材料的合成、测试过程。| 视频来源:Marilyn Sargent/Berkeley Lab【视频请前往“返朴”观看】

来自劳伦斯伯克利国家实验室的研究人员还搭建了名为A-Lab的实验室平台,可实现无机固体粉末材料的全自动合成。目标产物数据来自Materials Project和GNoME,合成配方由基于文献训练的自然语言模型提出,通过主动学习优化。经过17天的闭环运转,A-Lab进行了355次实验,成功合成了58种目标产物中的41种。研究人员表示,只需稍加修改决策算法,成功率就可以提高到74%,如果同步改进计算技术,则可以进一步提高到78%。(Nature News)

AI惨败!人类考92分的题,GPT-4仅得15分

各种方法在GAIA中的得分和答题时间。其中GPT-4 Plugins需根据遇到的问题人工选择不同的插件,AutoGPT-4的插件是自动选择的。Human一项指的是注释员在验证问题时的得分。| 图片来源:Grégoire Mialon ET AL

AI功能日益强大,在许多专业领域(比如法律、化学)的表现甚至超越了人类。但最新测试显示,AI似乎还远没有我们想象得那样“聪明”。研究人员近日在预印本网站arXiv上发表论文,提出了新的AI基准测试GAIA。在这项测试中,人类能正确回答92%的问题,而人工选择插件的GPT-4平均得分率仅为15%。

GAIA问题示例。答案是明确的,并且不会出现在训练集文本中。| 图片来源:Grégoire Mialon ET AL

此前的AI基准测试倾向于设计对人类来说越来越难的任务,GAIA则另辟蹊径,侧重于考察现实世界所需的基本能力,如推理、多模态处理、网页浏览和通用工具使用水平。这些问题对人类而言相对简单,却往往能难倒最先进的AI。GAIA包含由人类设计和标注的466个问题,依据难度划分成3个等级,场景涵盖日常个人任务、科学问题和一般知识。问题答案简短且唯一,因此很容易验证。研究人员认为,AGI(通用人工智能)应该在此类问题上表现出与普通人相近的鲁棒性,如果能从GAIA“通关”,将成为人工智能研究的一座里程碑。研究人员也承认,GAIA存在局限性,包括无法评估同一问题的多种解法、现实中的歧义问题,以及所有问题仅由英语提出,缺乏语言和文化多样性。(arXiv)

远程协作不利于科研创新

分工合作已成为现代科学研究的重要趋势,远程技术在其中推波助澜,帮助研究人员跨越地理阻隔,极大提升了协作效率。但研究人员也揭示了其消极一面:对数千万篇论文的分析表明,远程合作可能不利于创新,与线下科研团队相比更难取得突破性进展。研究指出,远程协作团队难以充分整合想法,这使得他们更多集中于涉及显性知识的技术性任务,而在构思创意和设计研究等概念性任务中表现不佳;“分布式”团队长于渐进式进步,拙于颠覆性研究。

研究人员分析了1960年至2020年来自2250万名作者的2000万篇论文,以及1976年至2020年来自270万名作者的400万份专利申请,以城市地理坐标为基准分析了合作者之间的邻近度。他们还引入“D分数(D score)”来评价论文的颠覆程度,取值从-1到1,1的颠覆性最强。D分数基于以下考虑:如果一篇论文经常与自己的参考文献一同被引,那么该论文就被视为“渐进性”工作;如果一篇论文在被引时独当一面(自己的参考文献未被引用),那么该论文就被视为开山之作。研究发现,过去50年里合作者之间的平均距离显著增加,论文方面从100公里增加到近1000公里,专利方面从250公里增加到750公里。但与之相应的,研究颠覆性在降低。当协作距离从同一城市增加到600公里时,颠覆性研究(D分数大于0)比率从28%下降到22%;颠覆性专利比率从67%下降到55%。相关论文11月29日发表于Nature。(Nature News)

探究大规模纠缠系统迎来新方法

纠缠是量子多体系统的一个显著特征。当几个基本粒子彼此作用后,各粒子属性以某种方式相互关联,无法单独描述粒子性质,只能描述系统整体性质。研究人员开创了一种新方法,首次通过实验证实了量子场论的预测,加深了对量子纠缠的理解。

在量子材料中,对强纠缠粒子进行测量会产生波动很大的随机结果,科学家将其称为"热"粒子,反之则是“冷”粒子。只有测量所有纠缠对象,才能揭示系统的确切状态。在量子多体问题中,纠缠带来的复杂度随系统规模扩大呈指数级增长,给测量带来了困难。研究人员新开发出一种更有效的描述方法,只需极少的测量次数,就能从系统中提取纠缠信息。他们在51离子的可编程量子模拟器上制备了一维XXZ海森堡链的基态和激发态,对多达20个格点的子系统纠缠哈密顿量(EH)样本进行了有效“学习”。研究人员通过计算机和量子系统之间的反馈回路确定其温度分布,计算机不断生成新的分布,然后将其与测量结果相比较。获得的温度分布曲线显示,与环境相互作用强烈的粒子是“热”的,而相互作用微弱的粒子是“冷”的,验证了理论预测。相关论文11月29日发表于Nature。(因斯布鲁克大学)

非洲企鹅通过独特“二维码”识别配偶

在实验中,一只名叫格里的非洲企鹅似乎认出了他的伴侣菲奥雷拉(左)。| 视频来源:BACIADONNA ET AL【视频请前往“返朴”观看】

在非洲企鹅(Spheniscus demersus)的白色胸羽上,有独特的黑点图案。Animal Behaviour近日发表的一项研究中,研究人员发现,这些黑点发挥着类似姓名牌的作用,能够帮助企鹅在长相相似的同类中识别出自己的配偶。

非洲企鹅 | 图片来源:BACIADONNA ET AL

研究人员向企鹅同时展示两张其他企鹅的照片,分别测量它观察照片和在照片附近停留的时间。他们推测,长时间凝视表明企鹅更熟悉照片中的个体。结果发现,与陌生个体照片相比,企鹅会花更长时间来查看配偶照片,平均时长23秒;在配偶照片附近的停留时间是其他照片的两倍。接下来,研究小组向企鹅展示两张配偶照片,但其中一张的胸部黑点被抹掉,结果企鹅会花更多时间来查看保留黑点的照片。最后,企鹅再次被展示了配偶和陌生个体的照片,这次两张照片中的胸部黑点均被抹掉,结果企鹅查看和停留的时间均没有显著差异——它们似乎不再能认出自己的配偶。研究人员表示,根据外表来识别个体是“我们过去认为非常特殊且高认知难度的一种特征”。新研究表明企鹅也能做到这一点。(Science News)

改吃健康饮食可延寿十年

坚持健康的饮食习惯可以预防非传染性疾病,延长预期寿命。据估计,不健康饮食每年导致英国超过75000人过早死亡,其中有17000人属于15-70岁的年龄段。研究人员分析来自英国生物银行(UK Biobank)467354人的前瞻性人群队列数据,发现如果从不健康膳食模式转向《饮食健康指南》(Eatwell Guide)建议的膳食模式,并加以保持,40岁男性和女性的预期寿命分别延长了8.9年和8.6年。对同一人群,如果转向并保持长寿相关的膳食模式,预期寿命将分别延长10.8年和10.4年。对于习惯中等膳食模式的40岁英国人,改变饮食习惯可使预期寿命延长3年左右。

图片来源:Pixabay

研究表明,长寿相关的膳食模式包括适量摄入全谷物、水果、鱼和白肉,大量摄入牛奶和乳制品、蔬菜、坚果和豆类;较少量摄入鸡蛋、红肉和含糖饮料;少量摄入精制谷物和加工肉类。其中,多吃全谷物、坚果和水果,少喝含糖饮料、少吃加工肉类带来的益处最大。相关论文11月20日发表于Nature Food。(Nature News)

本文受科普中国·星空计划项目扶持

出品:中国科协科普部

监制:中国科学技术出版社有限公司、北京中科星河文化传媒有限公司

特 别 提 示

1. 进入『返朴』微信公众号底部菜单“精品专栏“,可查阅不同主题系列科普文章。

2. 『返朴』提供按月检索文章功能。关注公众号,回复四位数组成的年份+月份,如“1903”,可获取2019年3月的文章索引,以此类推。

版权说明:欢迎个人转发,任何形式的媒体或机构未经授权,不得转载和摘编。转载授权请在「返朴」微信公众号内联系后台。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1