当前位置:首页|资讯|ChatGPT|百度|阿里巴巴|腾讯|科大讯飞

科技企业争抢“国产ChatGPT”,谁会胜出?

作者:南方日报发布时间:2023-02-16

原标题:科技企业争抢“国产ChatGPT”,谁会胜出?

“带资入组,不在意岗位、薪资和title,求组队。”原美团联合创始人王慧文一言激起千层浪。就在前几天,他在社交媒体上发布“宣言”,表示将出资5000万美元进军人工智能领域,期待联合顶级研发人才,共同打造中国的OpenAI,日后产出如ChatGPT一般的AI产品。

而在此之前,360、百度、阿里巴巴、腾讯、字节跳动、京东、科大讯飞、网易有道、快手等科技互联网企业也已纷纷表态,宣布要在ChatGPT及相关赛道布局。

他们之中,有的技术过硬,有的资本雄厚,有的掌握核心流量入口。那么,风口之下的这场“国产ChatGPT”争夺战,究竟谁能笑到最后?

●南方日报记者 许隽

扎堆入局

上线一周吸引上百万用户试用,推出两个月就达成“月活破亿”的成就,成为史上最受欢迎的消费者应用……ChatGPT的爆红“出圈”,让国内外科技互联网行业有些“上火”。

本月初,为对抗ChatGPT带来的冲击,谷歌仓促发布同类人工智能聊天机器人“Bard”;在国内,百度率先宣布将在3月初面向公众推出“文心一言”,且目前已邀请超过50家机构参与内测评估。除此之外,阿里巴巴、腾讯等十多家科技互联网“大厂”也在争先恐后。

以阿里巴巴为例,此前该公司向南方日报记者证实,其旗下的阿里达摩院正在研发类ChatGPT的对话机器人,目前处于内测阶段;字节跳动方面,相关产品据称也在测试中。至于腾讯,虽然并没有直接上马“国产ChatGPT”的迹象,但其不乏在AI大模型、机器学习算法等领域的技术储备,未来有望有序推进针对ChatGPT和AIGC产业的专项研究。

而除上述传统“大厂”外,一些互联网垂类赛道的玩家也在摩拳擦掌。比如,据媒体报道,好未来就有引入“类ChatGPT”技术的规划,目前公司正着手筹备研发ChatGPT相关教育项目;快手也曾对外透露,公司正开展大规模语言模型的相关研究,并已启动专项,覆盖LLM模型训练、文案自动创作与生成、对话系统开发等领域。

正如百度所说,“ChatGPT是人工智能里程碑,更是分水岭,这意味着AI技术发展到临界点,企业需要尽早布局。”不难预见,今后该技术领域还会迎来更多国内企业参与。

大厂突围

新兴赛道,竞争者众。单从技术储备来说,百度无疑是优势最突出的一方。

公开资料显示,早在成立之初,百度就已在人工智能领域积极投入。经过数十年的积累,百度已经具备人工智能运算所需的算力、算法和数据,在底层芯片、深度学习框架、大模型及最上层应用等领域均有布局,是国内少数拥有AI全栈能力的企业。

以大模型领域为例。与ChatGPT依托GPT-3模型完成训练类似,百度拟于今年3月推出的“文心一言”AI聊天机器人也有自己独创的训练模型——文心大模型ERNIE,且模型参数高达2600亿量级,远超GPT-3的1750亿。也就是说,如果将“人机对话”简单地比作一场考试,那么“文心一言”很可能比ChatGPT做过更多的真题。

与百度一样,阿里巴巴在“国产ChatGPT”争夺战中也有着很强的竞争力。根据日前曝光的阿里巴巴“达摩院版ChatGPT”测试结果,该工具同样拥有知识问答、生成程序代码、小说续写、报告撰写、诗词写作等功能,可以跟用户完成高效、流畅的互动;公司打造的多模态预训练模型M6拥有10万亿量级的参数规模,平均单卡可承载200亿参数。

据业内人士分析,“国产ChatGPT”争夺战第一阶段的胜方,一定是从百度、阿里巴巴这类巨头企业中产生,原因是“打造类ChatGPT产品,不仅需要搭建科学、前沿的训练模型,更需要前台交互和云计算技术作为支撑,这显然是大型互联网公司才能满足的要求。”

除此之外,还有成本的考量。有研究机构测算,训练1750亿参数语言大模型GPT-3,需要上万个CPU/GPU24小时不间断录入数据,所消耗的能耗相当于开车往返地球和月球,且单次训练就需要花费460万美元。这样“烧钱”的模式,中小企业显然无力承受。

重重挑战

抢占“ChatGPT”领域的技术高地,已经成为我国人工智能行业的共识。问题是,即便大厂成功突围,顺利打造出类ChatGPT产品,那与真正的ChatGPT之间又会有多少差距?

首先要面对的是训练参数上的差距。资料显示,支撑ChatGPT的GPT自然语言预训练大模型,自2018年到2021年已进行了三轮迭代,参数规模实现了从1亿、15亿到1750亿这一指数级别的增长。也正是通过对如此海量文本数据(覆盖网页、书籍、新闻等渠道)的深度学习,ChatGPT获得了比其他AI聊天工具更丰富的知识储备,即便面对复杂开放式问题也能迅速作答。而目前,除百度文心大模型ERNIE(2600亿)暂时实现超越外,国内大多数训练模型的参数还无法与ChatGPT所依托的GPT-3比肩。

而据最新消息显示,OpenAI筹备的GPT-4模型也将于不久后发布。根据往代GPT模型的迭代速度不难预测,其一旦上线,势必要引发国内企业的新一轮追赶。

再者,在训练模型上,我国企业还需要直面与ChatGPT依托的GPT-3之间的“代差”。有专家指出,在AI模型的发展理念以及相关技术的理解上,谷歌与GPT模型背后的OpenAI公司实际上存在半年到一年的差距,而国内企业则更是落后了两年左右。

此外,我国在部分核心芯片领域也面临“卡脖子”难题。正因如此,就短期而言,大厂打造的“国产类ChatGPT”产品即使面世,也可能需要正视差距,暂时扮演“追赶者”的角色。

但并非没有“弯道超车”的机会。据容联云AI研究院院长刘杰说,中国移动互联网的活跃度和体量领先全球,互联网应用发展速度也最快,这为AI技术和平台落地应用提供了广泛的场景。“在局部应用中开始超越,这也是业界的共识。”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1