文心一言正式发布,它能做到什么?和GPT-4比呢?我们也问了问ChatGPT的看法。
文丨智驾网 黄华丹
在GPT-4发布,再次引起一波AI生成热之后,今日(3月16日),百度文心一言(ERNIE Bot)也终于正式发布。
同时,今天起文心一言开启测试,用户凭邀请码即可登录使用。
2月,百度便官宣将在3月发布文心一言。但从今天发布会中百度股价表现来看,百度版的GPT显然没有满足用户的期待。发布会中,百度港股一度跌破10%,最终收跌6.36%。
发布会最让人失望的点应该在于文心一言的对话演示是提前录制好的视频。
不过,考虑到2月谷歌在演示其Bard时遭遇的翻车,百度选择了提前录制似乎也在情理之中。
2月8日,谷歌在展示Bard时发生常识性错误,导致谷歌母公司Alphabet股价大跌约8%,市值跌去1000亿美元。百度采用预先录制的措施显然也没让资本买账。
有网友调侃,将文心一言比作GPT-4边上的垃圾桶。不过,从发布会上的演示来看,虽然文心一言的功能要和GPT-4抗衡还有一段距离,但单独作为大模型来看,表现也算可圈可点。
01.
五大场景下的文心一言
我们先来看文心一言能做到什么。
发布会的演示视频展示了文心一言在五大场景下的表现,分别为文学创作、商业文案创作、数理推算、中文理解和多模态生成。
文学创作场景下,文心一言被要求回答关于《三体》的相关问题,并要求对续写,以及从哲学角度续写提出建议。文心一言回答如下。
商业文案创作方面,提出的要求是为公司起名字,写Slogan,以及写新闻稿。文心一言完成连续三次内容创作。
数理推算给出的题是鸡兔同笼,首个问题被文心一言反问“是不是题出错了?”纠正后文心一言给出解题过程和答案。
中文理解方面,对文心一言的要求是解释“洛阳纸贵”的意思及经济学原理,并就成语写一首藏头诗。
这些方面应该说是大众对生成式AI应用最熟悉的领域。
比较有亮点的是多模态生成场景。根据要求,文心一言已经能生成文字、图片、音频和视频。而且,在音频展示时,文心一言使用的还是四川话。
目前的测试版本已经包括文字、图片和音频生成能力。不过,由于生成视频成本比较高,还没有对所有用户开放,未来会逐步接入。
李彦宏表示,多模态是生成式AI一个明确的发展趋势。未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力,也会不断提升。
AI的发展深不可测,作为OpenAI的后来者,百度在发布文心一言时措辞也显得颇为谦虚。李彦宏表示,从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性,都逐渐接近人类水平。
但整体而言,这类大语言模型还远未到发展完善的阶段,有时候会有很惊艳的表现,但不少场景下,细究起来还有明显的bug,进步空间很大。未来这段时间它一定会飞速发展,日新月异。
02.
ChatGPT怎么看?
至于近期刚刚更新的GPT-4,已经有不少媒体详细介绍了其强大的AIGC能力,此处我们只简单进行介绍。
1,GPT-4的记忆增加了10倍,窗口可以记住25000字,相当于可以直接给它一本书,让它按照书的内容进行回答。
2,能够识别图片,输入图片,可以解释图片内容。
3,逻辑思考能力大幅增加,做数学题也没有问题。
据称,GPT-4已经以超过90%考生的成绩通过美国律师考试。而在演示视频中,只需手绘一个网站的草稿,将它拍照喂给GPT-4后,就能直接生成网页代码。
不过,GPT-4的发布并没有涉及更多的技术细节,也没有公布参数量。
从这些能力来看,文心一言还有很大的差距。此外,李彦宏也坦言,目前文心一言的能力还主要在于处理中文,在英语能力上和GPT-4有较大差距。
不过,也如李彦宏所言,作为内容生成AI,未来文心一言还有很大的发展空间。而且,百度作为继OpenAI后,全球首家正式发布内容生成AI大模型的企业,从展示效果来看,也是值得肯定的。
由于暂时还无法测试文心一言,我们只能调戏一下ChatGPT,问了问它如何评价文心一言。中文版提问和英语版得到的回答稍有不同。
中文提问版:
可以看出,ChatGPT认为文心一言更多的是一个针对文学领域的短文本创作工具。
英语提问版,为方便阅读已自动翻译成中文版。
可以看出中文版与英语版的区别还是有些明显的。
最后,我们又问了下它如何评价百度和OpenAI。
百度和OpenAI的共同目标为视为使用人工智能来增强人类的能力和帮助解决复杂问题。
03.
上车会怎样?
李彦宏表示,在人类进入人工智能时代后,IT技术的技术栈发生了根本性变化。过去基本分为三层:芯片层,操作系统层和应用层。现在可以分为四层:芯片层、框架层、模型层和应用层。而文心一言就位于模型层。
基于百度在四层架构均有产品布局的优势,文心一言在训练时能大幅提升效率,同时降低成本。
2019年百度便推出文心大模型ERNIE 1.0,目前已进化至ERNIE 3.0。
据李彦宏表示,目前已经有650家伙伴加入文心一言。而未来,作为一个通用的赋能平台,文心一言也将用于金融、能源、媒体、政务等各行各业。
李彦宏认为大模型时代将产生三大产业:
第一类是新型云计算公司,其主流商业模式从IaaS变为MaaS。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。
第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业Konwhow,调用通用大模型能力,为行业客户提供解决方案。
第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。
作为能提供交互的大模型,文心一言与GPT-4在车上的应用也非常值得期待。
此前,集度也已经宣布将搭载文心一言。同时,即将于3月18日上市的长安逸达也已官宣将搭载文心一言,成为国内首款搭载“文心一言”的量产车型。不过,目前并没有公布具体的细节。
此外,包括岚图、红旗、吉利、长城、零跑等多家车企均已表示将接入文心一言。
而ChatGPT方面,不久前,Teslarati刚刚曝出通用或将成为首搭ChatGPT的品牌。
据报道,通用正在使用微软的Azure云服务和OpenAI的技术开发一款新的虚拟汽车助手,由ChatGPT背后的人工智能语言模型提供技术支持。
除了能和用户进行语音交互,整合了ChatGPT的虚拟助手还可帮助车主获取车辆使用的相关信息,或从日历中整合日程安排提醒车主待办事项。例如,聊天机器人可以在仪表板上出现诊断灯时建议驾驶员采取什么行动,或在车辆信息娱乐系统上通过视频演示来指导用户如何更换爆胎。这将大大提高车辆的智能化水平。
而不久前,宝马在财报会议上又进一步展示了其数字概念车Dee,车主在车外即可与车辆进行对话。
未来,配备了人工智能和自动驾驶的车辆,将真正成为人类的陪伴者,而不再仅仅是车的角色。
赋创科技 2024-11-20
安在软件 2024-11-20