Touch JiangsuNowto follow
随着人工智能竞赛白热化,近日,脸书母公司Meta也宣布加入这场大战。
当地时间2月24日,Meta在其官网上宣布推出一款全新的 人工智能大型语言模型(Large Language Model、LLM),名为“Meta人工智能大型语言模型”系统(Large Language Model Meta AI),简称“ LLaMA”。
同近日爆火的ChatGPT不同,LLaMA并不是一个任何人都可以与之对话的产品。该模型旨在帮助科学家和工程师探索人工智能的应用,如回答问题和总结文件。
Unlike ChatGPT, LLaMA isn't a product that anyone can talk to. This model is intended to help scientists and engineers explore applications for AI such as answering questions and summarizing documents.
当地时间2月25日,首席执行官马克·扎克伯格(Mark Zuckerberg)在其个人社交账号上发文称,LLaMA旨在帮助研究人员推进研究工作。
扎克伯格写道:“大型语言模型”(LLMs)在生成文本、问题回答、总结书面材料以及自动证明数学定理、预测蛋白质结构等更复杂的任务方面表现出了很大的潜力。”
“LLMs have shown a lot of promise in generating text, having conversations, summarizing written material, and more complicated tasks like solving math theorems or predicting protein structures,” Zuckerberg wrote on Friday.
目前,不少大型科技公司和资金雄厚的初创公司都在竞相谋求AI技术的进步,并试图将其整合到商业产品中。
在这之前,已经出现的大型语言模型包括OpenAI的ChatGPT、微软Bing AI和谷歌尚未发布的Bard等应用程序。
Large language models underpin applications such as OpenAI’s ChatGPT, Microsoft Bing AI, and Google’s unreleased Bard.
据CNBC报道,Meta官方列举了其大型语言模型与竞争对手的不同之处。
首先,基础模型大小不一,Meta目前提供有70亿、130亿、330亿和650亿四种参数规模的LLaMA模型。
其次,研究人员将拥有该模型的使用权,在与研究相关的工作中使用。与之截然不同的是,谷歌的LaMDA和OpenAI的ChatGPT的底层模型是不对外公开的。
Meta also said that it will make its models available to the research public and is taking applications from researchers. The underlying models for Google’s LaMDA and OpenAI’s ChatGPT are not public.
如扎克伯格在贴文中所说,Meta正致力于打造一种开放的研究模式,为人工智能研究社区提供新模型。
“Meta is committed to this open model of research and we’ll make our new model available to the AI research community,” Zuckerberg wrote.
去年5月,Meta 曾推出一款大型语言模型 OPT-175B。该项目同样也是针对研究人员的,这构成了其聊天机器人 blenterbot 新迭代的基础。
去年年底,该公司还推出了一款名为Galactica的模型,但因被发现经常分享有偏见和不准确的信息,在48小时内被迅速下架。
出 品
版权声明
如需转载本公众号内容(文字、图片、视频):
1、请注明来源JiangsuNow、作者和二维码。
2、未按此规定转载的,JiangsuNow保留追究其法律责任的权利。
来源:CNBC、 Meta官网、华尔街见闻、VCG
编辑:钱盈盈
翻译:钱盈盈
审核:沈峥嵘
监审:沈峥嵘