作者:子渝
编辑:沈筱
Meta实现自动化对齐,Humpback击败现有LLaMa模型
8月15日,据消息,Meta AI 的研究者提出了一种可扩展的方法即指令回译(instruction backtranslation),该方法通过自动注释相应的指令来构建高质量的指令跟随语言模型。该研究从一个语言模型开始,并作为种子模型,该模型在少量的种子数据以及 web 语料库上进行了微调。种子模型的作用是用来构建训练样本,然后这些样本中的一些高质量样本将会被筛选出来,接着,这些数据被用来微调一个更强大的模型。经过两轮迭代的数据集对 LLaMa 进行微调,所产生的模型 Humpback 在 Alpaca 排行榜上优于其他现有的非蒸馏模型,如 LIMA、Claude、Guanaco 等。
https://k.sina.com.cn/article_3996876140_ee3b7d6c027011dpc.html
讯飞星火V2.0发布,升级代码能力和多模态能力
8月15日,讯飞星火认知大模型V2.0升级发布会召开,发布代码能力和多模态能力升级,同时发布并升级搭载讯飞星火认知大模型V2.0能力的多项应用和产品,包括利用代码快速生成或者改Bug的智能编程助手iFlyCode1.0、能够进行视频创作的讯飞智作2.0、帮助教师设计教学活动并一键生成课件的星火教师助手、面向学生口语练习的星火语伴2.0等。此外,科大讯飞还和华为联合发布讯飞星火一体机,为每一家企业提供专属的大模型,联合打造全国产化算力底座。
https://xinghuo.xfyun.cn/
最新GPT-4可极大提升社媒平台内容审核效率
8月15日,OpenAI表示,公司基于GPT-4开发出一种内容审核解决方案,其最新的GPT-4人工智能模型可以帮助企业在一天左右的时间内完成六个月的内容审核工作,可以加速处理内容审核等繁重任务,提高社交媒体公司的工作效率。同时,OpenAI的首席执行官萨姆·奥特曼(Sam Altman)还表示,公司没有拿用户生成的数据训练人工智能模型。
http://www.techweb.com.cn/it/2023-08-16/2932052.shtml
小米正式宣布小爱接入生成式大模型
8月14日,在小米的2023雷军年度演讲上,雷军正式宣布,小爱同学将升级生成式大模型。同时,小米官方放出演示视频,展示了大模型加持下,小爱同学的功能性。根据官方演示,新的小爱同学将支持智能问答功能,并能够根据用户的文字要求创作文案、甚至图片内容。在会议等场景中,新的小爱能够实现实时摘要与翻译功能。
https://k.sina.com.cn/article_5895622040_15f680d9802001hn8h.html
Meta MyoSuite2.0通过机器学习可模仿幼儿移动
8月15日消息,Meta AI发布的MyoSuite2.0系列,是与加拿大麦吉尔大学、美国东北大学和荷兰特文特大学的研究人员合作新项目。该项目将机器学习应用于生物力学控制问题,目的是展示人类水平的灵巧和敏捷。手臂和腿部是该团队迄今为止创建的最生理复杂的模型,协调大型和小型肌肉群是一个相当棘手的控制问题。该平台包括了一系列基线肌骨模型和开源基准任务,供研究人员尝试。
http://www.techweb.com.cn/it/2023-08-16/2932064.shtml
百度发布文心一言最新功能,新增 5 大原生插件
8月16日,由深度学习技术及应用国家工程研究中心主办的 WAVE SUMMIT 深度学习开发者大会2023在北京举行。百度首席技术官王海峰在深度学习开发者大会上表示,大语言模型具备了人工智能的核心基础能力,为通用人工智能带来曙光。百度的飞桨开发者社区已拥有800万开发者和80万个模型,并通过飞桨和文心大模型的加持,共建了星河社区。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜重磅发布了文心一言的五个原生插件:百度搜索、览卷文档(基于文档的交互)、E言易图(数据洞察图表生成)、说图解画(基于图片的交互)、一镜流影(文字转视频),文心一言现支持一次同时使用3个插件,不但扩展了大模型能力边界,也更适应场景需要。
http://nercdl.org.cn/zuixinzixun/289.html
OpenAI宣布收购Global Illumination
8月16日,据消息,OpenAI宣布收购Global Illumination 。Global Illumination由Thomas Dimson、Taylor Gordon和Joey Flynn创立于2021年,总部位于纽约,是一家利用人工智能打造创意工具、基础设施和数字体验的公司。OpenAI在声明中没有透露收购的具体条款,但表示Global Illumination的“整个团队”已经加入该公司,参与包括ChatGPT在内的核心产品的开发。OpenAI宣布将新一代大型语言模型GPT-4用于内容策略开发和内容审核决策,以实现更一致的标签、更快的策略优化的反馈闭环以及更少的人工审核人员参与。
https://techcrunch.com/2023/08/16/openai-acquires-ai-design-studio-global-illumination/
美国能源部投入1600万美元用于「AI+核物理」研究
8 月 17 日,美国能源部 (DOE) 宣布为 15 个项目投入 1600 万美元,这些项目将利用 AI 来加速核物理研究中的科学发现。这些项目将使用人工智能/机器学习(AI/ML)工具和方法进行核物理实验、模拟、理论和加速器操作,以扩大和加速科学影响。这 15 个项目将由能源部 8 个国家实验室和 22 所大学的核物理研究人员进行。项目将包括开发深度学习算法,以识别独特的信号,用于研究极其罕见的核衰变中的基本对称物理学,如果观察到这种信号,将证明我们的宇宙可能由物质而不是反物质主导。
https://science.osti.gov/-/media/funding/pdf/Awards-Lists/2875-NP-AI-ML-Awards-List.pdf
字节首个大模型独立APP亮相,AI对话产品“豆包”上线
8月17日消息,字节跳动基于语言方向的大模型产品有了新的进展。字节跳动已开始对外测试首个大模型独立APP——AI对话产品“豆包”,目前可在官网直接注册使用或通过官网提供的二维码下载App。豆包APP是此前字节内部代号为“Grace”的AI项目,目前拥有文生文、文生图的功能。据“豆包”官网介绍,其提供以AI对话为核心功能的技术服务,接入了利用深度神经网络、强化学习等技术训练的大规模语言模型以及其他模型及服务,模型采用对话格式,可以根据用户输入的指令,通过自动化分析后生成参考信息。
https://www.163.com/dy/article/ICC1T91E0553DXPD.html
最后一位Transformer论文作者离职创业,目标指向新型AI基础模型
谷歌最后一位Transformer论文作者Llion Jones离职创业,他与谷歌日本AI研究部门的前负责人David Ha共同创立Sakana AI,打造基于自然启发式智能的新型AI基础模型,其目标是做一家“世界级人工智能研究室”。相较于建造一个吸收所有数据的庞大模型,Sakana AI的做法可能是使用数量巨大的小模型,每一个模型所包含的数据集都不大但有独特的专长,然后让这些模型进行协作来解决问题。Sakana AI希望使用这些进化计算的原理构建人工智能,来解决AI系统成本和安全性等问题。
https://www.sohu.com/a/712747100_114984
“快手AI对话”产品功能开放安卓版本公测
8月18日晚,快手公布基于自研大语言模型应用的最新进展——“快手AI对话”功能已经在安卓版本开放内测。和传统大模型相比,快手AI对话是对于搜索新场景的探索。一方面将快手站内大量的内容资源作为索引,解决大语言模型AI幻觉的问题,提升回答准确性;另一方面也用更加有效地资源组织形式满足用户多元化需求,不仅覆盖生活常识、服务查询等内容,用户还可以进行追问,在个性化的场景中寻找到更适合自己的搜索结果。
https://news.cnstock.com/news,bwkx-202308-5108586.htm
联想发布大模型训练及训推一体AI服务器
8月18日,中国算力大会在银川盛大开幕,在“智算无限 全栈智能 联想AI算力战略暨AI服务器新品发布会”上,联想重磅发布两款全新AI服务器产品——联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。这两款服务器是基于AI导向打造的全新产品,能够助力构建更加绿色高效的人工智能数据中心,满足客户从训练到推理等多样的算力需求。联想问天WA7780 G3是一款专为AI大模型训练所打造的服务器;联想问天WA5480 G3 AI训推一体服务器,是联想问天品牌中的一款4U机架式AI服务器,支持多元的算力和丰富的生态。
http://www.techweb.com.cn/digi/2023-08-18/2932260.shtml
美国联邦法官裁定AI生成艺术作品不受版权保护
8月18日,据 The Hollywood Reporter 报道,美国联邦地区法院法官贝里尔・A・豪威尔周五裁定,AI 生成的艺术品无法获得版权保护。她审理了一起针对美国版权局的诉讼,原告斯蒂芬・塞勒(Stephen Thaler)使用他创造的创造力机器(Creativity Machine)算法制作了一幅 AI 生成的图像,但被版权局拒绝了授予其版权的申请。
https://www.hollywoodreporter.com/business/business-news/ai-works-not-copyrightable-studios-1235570316/?mibextid=Zxz2cZ
MIT 推出拾物机器人,可自然语言控制,低训练样本轻松取物
8月19日,据消息,MIT 推出拾物机器人,不仅能理解自然语言指令,还可以拾取没见过的物体。其研究人员将 2D 特征嵌入了三维空间,构建出了用于控制机器人的特征场(F3RM)。如此,在 2D 图像中构建的图像特征和语义数据,就能被三维的机器人理解并使用。不仅操作简单,训练过程中需要的样本量也很小,低训练样本实现轻松取物。除了拾取问题,还可以让机器人把拾到的东西放到指定位置。团队提供了完整的,没有经过筛选的实验结果。他们在实验室周边随机选取了 out-of-distribution (训练集外)测试样本。其中使用 CLIP ResNet 特征的特征场在三成以上的测试样本中 (78%)成功抓取和放置。在基于开放性人工语言指令的任务上,成功率在 60%。
https://f3rm.github.io/
《纽约时报》禁止其新闻报道用于AI模型训练并考虑起诉 OpenAI
8 月 20 日消息,据 NPR 报道,OpenAI 可能面临《纽约时报》的起诉,原因是该公司使用了《纽约时报》的文章和图片来训练其人工智能(AI)模型,这违反了《纽约时报》的服务条款。如果诉讼成功,OpenAI 可能会遭受巨大的损失,包括删除其数据集、支付高额罚款等。
http://www.techweb.com.cn/internet/2023-08-20/2932299.shtml
商汤为AI agent打造任务规划和工具使用能力
此前在自然语言处理领域,人们在看AI解决复杂任务时更多关注任务理解,而缺乏对工具使用和任务规划能力的研究。为了弥补这一缺陷,商汤的研究人员提出了一种针对基于LLM的AI智能体的任务规划和工具使用方法,并设计了两种不同类型的智能体执行推理过程,包含六个组件的AI智能体框架。基于LLM的AI智能体在任务规划和工具使用方面具备一定的能力,并且通过改进生成策略可以显著提高代理的性能。
https://www.qbitai.com/2023/08/78496.html