当前位置:首页|资讯|百度|微软|文心一言|ChatGPT|GPT-4

百度文心一言发布,中国可以有自己的ChatGPT吗?

作者:未尽研究发布时间:2023-03-16

昨天GPT-4,今晚微软Office365+GPT-4,夹在中间,百度发布了文心一言,第一个中国版的ChatGPT。

可能因为GPT-4已经吊足了人们的胃口,人们期待是看到惊艳,展示出一些超越人类的能力。

一段时间以来,股民们隔岸观火地炒作中国资本市场的ChatGPT概念,也到了产品出来溜溜的时刻。

结果百度股价暴跌,一度达8.91%。

这是一个备受期待的事件。人们想从这场发布中找到一个答案:中国可以有自己的ChatGPT吗?在自然语言的人工智能应用中,人们可以用上真正的中文应用吗?新一波技术的范式转移已经开启,中国能否复现当初的互联网历史,迅速赶上,在一些应用方面形成自己的创新,甚至超越?

百度是中国最早投入人工智能研发并应用的科技公司,从2010年起就把机器学习应用于搜索,2013年起把深度学习应用于搜索。

2019年,百度发布了语言大模型文心 (Ernie),此后每年都会有一个新的版本。可以说在自然语言大模型的领域,百度与美国同行之前基本处于同一节奏。

但去年11月ChatGPT的发布,颠覆了这一节奏。而当ChatGPT发布时,号称是基于GPT-3.5,而当时OpenAI甚至已经完成了GPT-4的训练环节。

“在ChatGPT之后,甚至昨天刚刚发布GPT-4之后,百度是全球大厂中第一个发布同类型与同级别的产品。”百度创始人、董事长CEO李彦宏开场表示。

“自己内测,难称完美”。但之所以选择这个时间发布,是因为百度自身的主要业务搜索、智能云、小度、自动驾驶,都眼巴巴地等着用上这一技术。而百度的合作伙伴也在催其尽快发布。

百度希望“一旦发布,用户反馈将加快它的成长。”

然后,李彦宏展示了事先录制好的功能展示及效果体验。

文学创作。以《三体》为例,6轮问答概括了内容、如何续写,还扩展到三体的电视剧,主要演员等等,体现出总结,分析,推理的能力。

支持答案事实部分的,包括了百度知识增强和检索增强的技术。“我们有550亿的训练数据支持我们的事实部分。”

商业文案的创作。起名,公司 slogan,生成600字新闻稿。“达到千亿量级参数时,就会发生智能涌现,没教过的能力也出来了。”

数理逻辑的推算。鸡兔同笼数学题。对提问进行了纠错,而且正确推理,解题。

对中文的理解。“应该超出世界上任何一个预训练大模型。” 演示回答了洛阳纸贵,当时有多贵?有经济学分析。还写了一首藏头诗。

文心一言也能处理英文,“但达不到中文这么好。接下来会加强训练英文,更多语种,以及跨语种能力。”

多模态生成。李彦宏演示了一个活动的海报创作。智能交通在哪些城市最适合发展,文字生成后,用四川话描述一番。并且将以上内容生成视频。目前多模态所有能力,仅对百家号的创作者全部开放。

百度CTO王海峰介绍说,文心大模型是百度十几年”超大规模的研发投入一点一点积累起来的。进步速度会非常快。通过微调,去适配百度内外的各种产品,在用户界面展示出惊人的亲和力。”

他介绍了百度大模型的技术栈,包括芯片、框架、模型、应用四层。在激烈竞争的全球大厂中,“百度在四层都有优势,绝无仅有。”

“大模型的算力需要四层之间的协同优化,尤其是在框架层实现的协同,令百度在预训练中受益。”

最大的机会在应用开发

目前已经有650家企业宣布接入文心生态。

李彦宏认为,生成式AI是技术范式的转变,会带来市场需求的释放。不仅影响搜索,而且会影响互联网和其他技术能力。

千行百业都在“利用能力让自己的产品离客户更近。让工作性质都会发生不可逆转的改变 。”

李彦宏认为大模型为中国带来的创业与商业机会,主要体现在三个方面:

新型云计算。主要商业模式,会从IaaS (基础设施作为服务),转变为MaaS (模型作为服务)。两周后,百度将单独发布智能云。

行业模型精调。应用于工业,金融,交通,能源,媒体等,加快各行业的数字化转型。

应用开发。大模型时代,最大的机会,正是在应用。将出现杀手级的应用,现象级的产品,会接连不断地跨越一个又一个的里程碑。

也许对于百度和李彦宏来说,最重要的是迈出一小步,把文心一言推出到真实的世界中,进入中国用户的RLHF中(人类反馈增强学习),进入中国式的对齐(alignment ) 环境中。

自然语言模型,正在迅速向多模态、更加向人类看齐迭代。它是一个学习的机器,在与人类的互动中,正逐步为新的知识体系进行编程,这一趋势一旦启动,将会加速演变。

在AI的大模型中,各种语言之间将会被真正打通,语言中蕴含的智慧和知识将会泛化到不同的语言。语言大模型的不断精进,其能力也会泛化为多模态,甚至进入更多的技术与行业领域。

它不是中美技术对抗的工具,而是百度十多年来在人工智能技术上研发创新的结果。” 李彦宏总结说。

百度开了个头,我们期待下一场大模型的发布会,它们可能来自:

腾讯。混元大模型。针对类ChatGPT对话式产品,腾讯已成立了“混元助手(HunyuanAide)”项目组。

阿里巴巴。通义大模型。阿里版聊天机器人ChatGPT正在研发中,目前处于内测阶段。传言可能与钉钉生产力工具深度结合。

华为。盘古大模型。基于昇腾(HUAWEI Ascend) 芯片等全栈式解决方案。

京东。京东云言犀平台将推出ChatJD。

此外,北京智源、IDEA(粤港澳大湾区数字经济研究院)等研究机构,深言科技、智谱AI、聆心智能、西湖心辰等背靠高校的初创企业,以及光年之外等互联网高管的再创业项目。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1