编者按:1956年,人工智能(AI,Artificial Intelligence)的概念首次提出,迄今已逾六十载。60年来,AI历经了从爆发到寒冬、再到野蛮生长的历程,伴随着人机交互、机器学习等技术的提升,AI成为了技术时代的新趋势。
2022年,AI行业再度迎来新的节点,人工智能生成内容(AIGC,AI Generated Content)后来居上,以超出人们预期的速度成为科技革命历史上的重大事件。无论是“AI画师”DALL-E2,还是“万能陪聊”对话机器人ChatGPT,生成式AI正在迅速催生全新的科技革命系统、格局与生态。
时针转至2023年,由AIGC引发的热度不减反增,而全新的智能创作时代在带来深刻生产力变革的同时,也将进而改变人类的思想演进模式。就此,21世纪经济报道数字经济课题组策划了“逐浪AIGC”系列报道,多维解读AIGC带来的技术可能和商业图景。
21世纪经济报道记者李强 北京报道
AI热度连续几日强势霸榜。
从3月15日开始,GPT-4发布、文心一言亮相、GPT-4接入Office全家桶,几乎每天都有新的话题。
其中比较有戏剧性的一幕是,百度在发布国内首个生成式语言大模型“文心一言”后,明明是国内最有潜力追赶AIGC浪潮的选手,台下却是一片调侃和喝倒彩。
“在文心一言内测过程中的体验来说并不完美,因为市场有需求才选择在今天发布。”不管是百度创始人兼CEO李彦宏,还是百度CTO王海峰,在发布会上的态度都拘谨而谦逊。
在GPT-4吊足人们胃口的情况下,尽管也都明白百度仍处在追赶阶段,但百度的真诚却没能换来市场的客观看待。一个更加挑动人情绪的细节是,发布会现场并没有直接调用文心一言看实际效果,而是用PPT和录屏的方式演示,市场直接理解为对于产品的信心不足,大量调侃文心一言远远不如GPT-4的恶搞图在社交媒体上转发,百度(09888.HK)的港股股价也一度暴跌10%。
不过,随着百度逐渐开放测试,人们发现文心一言的表现并没有调侃中的那么糟糕,同时在国内其它大厂尚未给出时间表的时候,百度敢于以落后的姿态“先上桌”,颇体现出几分破釜沉舟的决心。
“一个是典型的美式英雄主义,一出场就是干炸,完全的颠覆式创新,魔法级的技能让全球瞠目结;一个是典型的中式实用主义,没有英雄,没有浪漫,很务实的市场需求理解,把十多年的积累组合升级,一点都不酷,还显得有点生涩。”在发布会现场,一名不愿具名的资深行业观察人士发了这样一条朋友圈。
情绪趋于冷静之后,市场对于百度的信心也在回归,截至3月17日收盘,百度港股股价大涨13.67%。继16日先跌后涨之后,17日百度美股也再收涨逾6%。
追赶
OpenAI之前,由于训练成本高昂,以及投入后的实际效果未知,导致海内外大厂几乎没人敢押宝在大语言模型上。
因此,尽管许多高校以及大厂研究团队也早早开始探路大参数模型,但基本以项目和论文为导向,没有持续迭代,像谷歌的PaLM等参数量级比ChatGPT相近甚至大得多的模型,最终都没有被广泛应用。
OpenAI的与众不同之处在于,它不仅是个科研团队,还是个创业公司。OpenAI将大模型作为产品,在GPT-3 API开放后,根据用户实际使用数据,不断迭代打磨优化。
之所以能成功推出ChatGPT,并不是OpenAI在算法上实现了实质性创新,而是工程化上的长久积累:把模型当产品迭代,投入几百个工程师做“脏活累活”,包括数据清洗、模型后续的微调和基于人类反馈的强化学习(RLHF),并在这个过程中,形成了一个高效的“模型训练流水线”。例如,ChatGPT的问世,RLHF发挥了非常重要的作用,GPT-3.5底层模型实际只用了6万条数据优化,但是优化的效果非常明显。
问题在于,工程化的细节对于外界始终是个黑盒。论文只公布了数据处理有哪些环节和每个环节使用的数据量,但什么数据用在哪个环节、强化学习奖励模型是怎么做的,需要其它试图跟进的厂商自己一步步摸索尝试和积累,这也是OpenAI与其他玩家真正拉开差距的地方。即使现在ChatGPT为大模型指明了发展方向,要真的把工程化做好,把这种高效运转的“流水线”建起来,也仍然需要时间。
“大模型的训练并不是集中几千张GPU训练几个月之后就结束了。数据在不断变化,用户与模型交互提出的问题也在不断变化,数据的供给和需求两端的变化推动着大模型必须不断升级迭代。如果不更新,很快就会被竞争对手超过,失去价值。这是一个非常重资本、算力、人才投入的业务,因此必须是规模很大的公司来做,最核心比拼的是谁能建立起一套模型生产体系,以最高的效率更新迭代模型。”Atom Capital分析指出。
“全球的大厂当中,百度是第一个发布的,微软是直接调用OpenAI,而Google和Facebook等大厂都没有发布同类型、同级别的产品。”李彦宏在发布会上表示。
但值得注意的是,OpenAI在发布最新的GPT-4时,并没有像之前一样挂出技术文档或论文,解释技术如何实现,而是以一种更加封闭的状态展示着自家的产品力。与曾经致力于推动造福人类AI的非营利性研究机构相反,估值达到三百亿美元的OpenAI正迅速成长为拥有垄断地位的大厂之一。
“国内的公司此前在生成式语言大模型已经有一些探索了,如果要达到类似ChatGPT的效果,还需要更多资源和时间的投入。当然像芯片等方面可能会面临一些阻碍,但是应该也会有一些其他的解决方法。科技大厂在训练上取得了一些初步优势后可能通过开源的方式去降维打击,创业公司如何更好地利用开源的模型,能否构建出属于自己垂直领域、更精细化的小模型也值得期待。”CMC资本董事总经理易然分析道。
激活
“想到可以帮助更多人一起应对AI的大潮,我就兴奋得不行。”百姓网CEO王建硕很早开始便开始摩拳擦掌。
百姓网成立于2005年,是中国最早的分类信息服务网站之一。2016年3月14日,百姓网在新三板挂牌。2022年,百姓网利用其数据和技术优势,结合大语言模型,拓展人工智能服务,成立BaixingAI业务。在消费市场方面,推出智能聊天机器人;在企业级市场方面,推出对话式人工智能支持中台,赋能不同行业搭建自己的对话式人工智能方案。
作为AI的坚实拥趸,王建硕带领百姓网在第一时间接入了文心一言,成为首批生态合作伙伴,并随后宣布百姓网将进入AI教育领域,从零开始构建课程,并用未来的几年的时间帮助上千万普通人进入AI的新世界。
“普通的对话效果,好于我的预期,高级的prompt engineering(直译为‘提示工程’,指设计输入数据,使用户能够清楚地描述任务,引导AI给出正确合理的输出,进而完成更为复杂的任务)编程能力,还没有支持。作为一个开端,相当不错。我一直认为百度明天底做出一个相当不错的模型是大概率事件,在3月份就出来一个不错的产品是小概率事件,现在的体验是基本可用。”对于文心一言的表现,王建硕还是给予了肯定。
“大模型很强大,但它不懂我公司具体的年假政策,不了解我的客户的历史情况,不被群里面宝妈相信,不能解决所有的问题。这就使得未来不仅仅会出现生产机器人的能力,同样也会出现大量对特定场景机器人的需求。”王建硕补充道。
未来会有多少机器人,在王建硕看来,这个数字可能是数千万个,人们日常的查询、购物、工作等动作都将会演化为调动特定机器人去执行,这也意味着人们需要学会如何与机器人交互。
“千万不要以为这项新的技能不需要学习,一旦新世界的大门打开了,用简单的句子就可以完成以前复杂的任务,一定会催生用复杂的句子,完成以前几乎不可能完成复杂的任务。”王建硕补充道。
根据介绍,百姓网会提供免费课程和付费课程以及高阶的开发课程。其中,免费课程会邀请已经在ChatGPT领域有积累的先行者们分享技术使用方法,付费课程则是探讨ChatGPT的技术如何在企业里面应用,将企业文档系统,客服系统,员工培训,社区管理等大量任务交由AI;更高阶的开发课程则是帮助程序员顺利从写Python等“高级语言”转换到用“Prompt Engineering”等方式跟大语言模型互动,更加高效地创建APP。
“这一轮的文心一言最大的关注度并不在C端,普通用户并没有深刻直观的理解,更加重要的是AI下的产业互联网,尤其是我们看到各个下沉的细分行业,它们对于AI的诉求已经被激发出来了。”前述不愿具名观察人士向21世纪经济报道记者分析道。
根据百度提供的数据,自2月7日发布,已有650家企业宣布加入文心一言生态,参与特定场景化下的训练和推理。而在文心一言发布会后一小时内,排队申请文心一言企业版API调用服务的企业用户已达3万多家,首日有6.5万家企业申请调用,市场的反响非常热烈。
“我们回看20年前的百度,很多东西搜不出来,使用体验也很差,但你难道说这个场景不成立吗?肯定不是。生态不是一天繁荣起来的,技术上的不足可以迭代优化,只要模式验证了,抓住先发优势才是关键。”前述不愿具名观察人士表示。
冲刺
仅仅四个月时间,AIGC便从ChatGPT初出茅庐,延伸至生产力端,让人惊呼“又快又好”。
近日,Linkedin联合创始人Reid Hoffman宣布,其完成GPT-4合作撰写的书籍《Impromptu:通过A放大我们的人性》,成为“Prompt Engineering”的吃螃蟹者,微软也宣布将GPT-4植入Office全家桶,用户可以直接将word转化为PPT……
尽管跟风中的科技公司们纷纷宣布在大模型技术上有所积累,但大模型注定是巨头的的牌桌,除了行业“鲶鱼”,众多厂商重新投入再造“文心四五六七八言”的意义也会越来越小。同时,应用层如何落地也是大模型浪潮中最值得关注,以及声浪最大的“军备竞赛”。
“未来可能会出现两类创业公司,一类是以现有业务为主的AI+,大幅度提升效率和体验;另一类是充分发挥大语言模型的技术突破,完全颠覆现有业务、带来新的用户群体或开启全新的应用场景。”Atom Capital表示。
目前,大厂已经开始了效率之战。
3月15日,谷歌向开发人员和企业公开了PaLM API,用户能通过谷歌云和AI建构工具MakerSuite来构建AI模型,或是将聊天机器人功能编程到自己的应用程序中,谷歌还在谷歌企业级线上协作平台Google Workspace中引入了生成式AI功能,可以实现自动撰写电子邮件或生成文档摘要等功能,覆盖Gmail、Google Docs、Sheets等组件。
微软也在3月16日发布Microsoft 365 Copilot,通过将Copilot嵌入至Office全家桶中,协助用户完成创作、分析等工作,同时能够以聊天对话框的形式展示给用户,通过汇集全家桶数据,协助用户完成总结聊天、撰写邮件、编写计划等工作。
“如果我们用工业性思维去看,AI是能够完成很多的劳动力替代的。举个例子,除了大家讨论最多的新闻和设计,像律师、金融这些工作每天也要审核大量资料,基本也都是技术水平不高的重复性劳动。而这些AI未来可能延伸到的场景现在都还是蛮荒阶段,大家目前还是尝鲜的状态,象征性地聊个天,至于大家觉得恐慌也好,关注也罢,只能说我们对于AI的认识仍然有待挖掘。”老王对记者表示。
正如AI发展历程,技术突破引发人们的狂欢与畅想,激起一波波浪潮,潮起又潮落,如今,随着OpenAI将大模型推到台前,新一场大戏的台幕也正徐徐拉开。