“十月怀胎,一朝分娩”。3月16日下午,百度正式对外发布官宣已久的文心一言。百度创始人李彦宏亲自展示了文心一言的五大能力:“文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成”。“文心一言对标ChatGPT、甚至是对标GPT-4,门槛是很高的。我自己测试感觉还是有很多不完美的地方。”
据悉,3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。
《科创板日报》记者获悉,发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家。
但较为遗憾的是,百度此次在发布会现场并未使用现场实时演示,而是采用提前录制好的演示视频进行了文心一言的能力展示。该产品发布后,百度集团股价出现持续下挫,截至收盘跌幅达6.36%。
文心一言未进行"现场答题"
在现场,百度主要展示了在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
在文学创作方面,李彦宏与文心一言进行了六轮对话,包括让其从哲学角度来续写三体小说的核心内容。
李彦宏还在现场演示了商业文案创作方向的能力,比如为公司起名字、写宣传语、写新闻稿等。在数理逻辑推算任务上,李彦宏演示了文心一言回答逻辑思维领域的经典题目“鸡兔同笼”。
就在百度发布文心一言的前一日,OpenAI刚刚发布了其大型语言模型的最新版本——GPT-4。GPT-4是一个大型多模态模型,支持图像和文本输入,再输出文本回复。
在现场,李彦宏也演示了一段多模态生成方向的Demo,包括创作海报、用四川话阅读文字内容,并自动生成相关内容的视频。
不过,在演示过程中,不少网友吐槽其所有的问答像是先录好的视频,而非实时交互,甚至有网友戏称其为“ChatPPT”。对此,李彦宏也承认,文心一言现场回答的问题实际上是提前录制好的视频,这是为了保证演示效果。
“自己测试(文心一言)感觉还是有很多不完美的地方。” 李彦宏在会上坦言。
《科创板日报》记者从接近百度的人士了解到,其实包括百度内部包括技术团队对于这么快推出文心一言,并不是没有不同意见,但看到ChatGPT推出后带来的轰动与商机的李彦宏,坚持要求火速推进并尽快推出,并亲自领军和监控项目进展。
对于为何要加快发布文心一言,李彦宏今天的说法是,因为市场有需求。
“百度的很多产品,从搜索到智能云,再到自动驾驶,到小度,大家都有需要,更重要的是我们的客户需要,合作伙伴需要,从我们承认文心一言的存在到现在,短短一个月的时间,就有超过650家合作伙伴宣布加入文心一言生态,大家都希望能早一点用上最新最先进的大语言模型。”
文心一言将全面嵌入百度产品线
此前,李彦宏内部信中介绍,百度计划将多项主流业务与文心一言整合,包括与文心一言与搜索整合,将引领搜索体验的代际变革;文心一言将通过百度智能云对外提供服务,根本性地改变云计算市场的游戏规则;此外,文心一言大模型还将搭载到Apollo智舱系列产品,并与小度进行集成。
有接近百度的人士告诉《科创板日报》记者,王海峰作为百度首席技术官,是公司人工智能体系总负责人,也是文心大模型的统管者。百度目前拥有的最先进英伟达A100芯片群,也是大部分优先供文心一言项目使用。
《科创板日报》记者获悉,在研发过程中,文心一言被作为内部高度保密项目,成了专门的封闭开发小组。“其他部门难以接触到,也不让对外透露任何相关的消息。”
一位熟悉百度的人士告诉《科创板日报》记者,文心一言首先会进入到搜索场景之中。“通过提供更好的搜索体验,全新的交互方式、聊天互动体验,以及深层次的内容,来扩大搜索的服务场景和市场规模。百度希望创造下一代互联网新的流量入口。”
在ChatGPT爆火后,微软已将其接入旗下的搜索引擎必应(Bing),还将整合OpenAI的技术宣布推出Azure OpenAI服务,Azure全球版企业客户可以在云平台上直接调用OpenAI模型,包括GPT、Codex和DALL.E模型。
参考微软近来的举措,百度如无意外也会将其类ChatGPT技术作为平台对外开放,供第三方开发应用。
《科创板日报》记者从知情人士处获悉,文心一言的服务也计划在百度智能云上线,预计时间可能在今年5月份左右。通过在百度智能云上提供对外的服务接口,供一些核心用户使用。
在自动驾驶和智能交通场景,百度会在通用大模型的基础上,建立交通行业大模型,从而在智能信控、智慧高速等场景形成特有的解决方案。
此外,百度系产品以及相关生态公司,比如百度地图、Apollo、小度、爱奇艺等,都已经开始启动全面接入文心一言的能力。
距离GPT-4有多远?
当前,OpenAI的API难以直接面向中国用户/企业开放,这为国产版ChatGPT留足了机会。
但在《科创板日报》记者的采访中,目前,不少业内人士保持谨慎态度。
一位国际知名厂商的搜索引擎领域专家对《科创板日报》记者直言,“目前可能还是做不出来同等的水平,达到GPT3模型水平的有,但关键在于Chat没有,交互对话存在很高的技术壁垒。”
除百度外,阿里、腾讯、360等公司也都在类 ChatGPT、AIGC 技术上有布局。此前360表示,公司的类 ChatGPT 技术的各项指标只能达到略强于 GPT-2的水平,与当前的 ChatGPT 相比尚有技术代差。
对此,红点中国相关负责人指出, “要追赶这些先进模型,国内需要投入大量资源和精力,包括人才、财力、算力等方面的投入。同时,还需要解决语言模型训练中的技术难点,如中文的数据准备、大规模集群算力的搭建、模型训练的速度和效率、模型的可解释性等问题。”
另有科技业内人士分析称,国内在ChatGPT上落后的原因,是前两年把资源更多地放在产业互联网和B端业务,涉及的是产业端的小模型,而没有把精力放在面向C端的通用人工智能,导致错失了时间窗口机遇。
某接近百度的人员认为,“底层的transformer模型已经出来多年,很多大厂也大多围绕这样的路线来演进,严格来说,GPT并非底层模型的颠覆性创新,更多的是非常巧妙地结合了语义的理解、生成、交互相结合的方式,再加上人类反馈的强化学习,然后实现了这样一个惊人的效果。”
某涉足大模型领域的相关人士对《科创板日报》记者表示,类GPT的路线此前各家都在研发,但没想到还是国外第一个做出来,现在大家也铆足劲在追赶。“从差距来看,个人觉得没有那么大。”
更多资讯关注公众号 质检协会人工智能专委会