ChatGPT这把火,正烧得越来越旺!
去年11月底上线,当时仅在AI和科技圈内小火了一把,没想到在今年春节后,火爆出圈,表现实属惊艳——瑞银集团在今年2月1日发布的一份关于ChatGPT的报告中表明,到今年1月末,也就是ChatGPT推出仅两个月后,月活已破亿大关,并称这是互联网领域发展20年来,增长最快的消费类应用。
另外,该报告援引分析公司Similarweb的数据表明,1月期间,ChatGPT平均每天独立访客约有1300万,是去年12月的两倍之多。
与此同时,二级市场情绪也被迅速点燃。自去年11月以来,A、港、美三地二级市场,ChatGPT相关概念股热度持续升温,且持续向泛AI和数字经济板块扩散。
显然,ChatGPT本身强大的语言理解和生成能力是其俘获众多用户的杀手锏,而其背后所预示的变革及无限的商业潜能,更是令产业资本、风险投资者为之着迷,甚至疯狂的关键。
例如,比尔·盖茨称其历史意义不亚于互联网和PC的诞生!当然,ChatGPT的成功,也离不开微软的支持——其背后的开发商Open AI除了连续三次获微软数十亿美金的投资之外,还享有这家全球最大的云服务商提供的独家算力支持和优待。此外,需要留意的是,今年1月17日,微软CEO纳德拉进一步对外表示,下一阶段计划将包括ChatGPT、DALL-E嵌入旗下全线产品。
马斯克也忍不住发推称赞自家的产品,尽管其已从OpenAI董事会出局,与该公司已无多大利益关联,且一直以来都在呼吁外界警惕人工智能带来的风险。
对于新技术带来的机会,巨头们锐意进取的态度有目共睹,但对此所引发的担忧也可见一斑。例如,谷歌元老、Gmail的创建者之一Paul Buchheit于近日发推表示,谷歌可能只需要一两年时间就会被彻底颠覆,AI将会消灭搜索引擎的结果页面!
由于ChatGPT问答环节的优异表现,根本上是基于深度内容的搜索,同时结合对话场景,极大地提升了搜索交互的效率和体验,因此这也引起了市场对其替代甚至颠覆传统搜索引擎的广泛讨论。
中信证券认为,尽管ChatGPT能大幅优化用户的搜索体验,但要取代传统搜索引擎仍然面临多个关键技术瓶颈,且其预计ChatGPT的成功不会给搜索产业带来颠覆性的新入局者,但会推动谷歌等搜索巨头加快迭代大语言模型辅助传统搜索引擎的新格局。
而在Paul Buchheit看来,颠覆谷歌垄断地位的可能不是ChatGPT这个应用,但技术的进步肯定会彻底改变人们获取信息的方式。
对此,谷歌无法坐视不理——除了转投AI初创企业Anthropic(ChatGPT竞品)之外,还在最新一季度的财报电话会中表示,未来几周或几个月将正式推出类似ChatGPT基于大语言模型的人工智能,将以搜索伴侣的形式辅助其传统搜索引擎,从而重塑其现有业务体系。
无独有偶,国内方面,百度也宣布将在下个月推出与OpenAI的ChatGPT类似的人工智能聊天机器人服务,并将其嵌入其搜索服务中。此外,美版“今日头条”Buzzfeed和亚马逊也在探索ChatGPT的应用场景。
当然,ChatGPT的成功其实并非偶然——继去年Midjourney(AI绘图工具)火爆出圈后,Stability.AI、Runway、Jasper.AI等AI生成内容工具开发商,也相继得到资本的青睐,并带火了市场对于AIGC的投资热情。
归根结底,ChatGPT的成功是技术发展积累和突变的结果,特别是底层技术。
众所周知,算法、算力和数据是共同制约AI发展的三个关键要素,这些在过去十年都完成了由量变到质变的一个过程。其中,去年更是被机构视为技术层面的一个拐点,不论是数据量级、算法模型/架构都达到了一个临界点。
从根本上讲,ChatGPT优异的问答表现以及所能延展出丰富的使用场景,依赖的是其背后自然语言处理(NPL)和生成模型的支持。而从这个视角来看,如今的ChatGPT其实是经历了四轮迭代后的版本,堪称是机器学习、神经网络和Transformer算法三大技术的集大成之作。
其中,最初版就开始采用的Transformer生成式预训练模型,是基于谷歌于2017年提出的Transformer架构,使得AI在文字、语音、图像识别、语言理解等领域达到了超越人类的水平,以此为基础的大模型路线成为发展共识,后经Open AI改造,这也是ChatGPT乃至AIGC火爆背后最为关键的技术变量。
正是基于大模型,加上高质量的数据以及不断的强化训练(PPO算法),大幅提升了ChatGPT对于人类意图的理解能力,并结合对话场景,凭借流畅、高质量的回答体验,加速了其出圈。
另外,大模型之大主要体现在海量的数据规模,尤其是参数量,可以类比人脑的神经元。据了解,ChatGPT是微软使用Azure AI超级计算基础设施上的文本和代码数据进行训练的大模型,参数量多达 1750 亿个,而目前研究发现的人脑神经元最多也在1000亿个左右。
目前市场对于ChatGPT远超市场预期的表现,已逐渐形成多方面的共识和预期:
1)将极大地提升内容生产力,率先落地于AIGC领域,打开其产业的想象边界;
2)大模型成为AI赛道的必争之地,走向通用AI的主流路线;
3)AI发展步入全新阶段,即从弱人工智能迈向强人工智能。
那么,哪些行业以及企业大概率会是这轮技术红利的深度受益者?
首先,直接涉及ChatGPT和AIGC的产业化。 而从中短期视角来看,主流机构也普遍给出了几个较为明确的方向:
其一,文本生成。ChatGPT作为文本模态的AIGC,其应用具有直接的现实意义,特别是在归纳性文字类工作中展现出极为优异的表现。所以,未来向包括会议总结、文件翻译、例行报告等办公场景迅速延展获看好。
目前,主打文字生成的初创企业如Jasper,主要针对社交媒体、广告、文章、邮件等不同类型的内容生成。除此之外,海外巨头也纷纷跟进合作,在传媒、写作、办公等领域开始落地应用。据悉,BuzzFeed已宣布与OpenAI合作写稿。
其二,代码生成,即将自然语言翻译成代码,从而极大地提升编程效率。以谷歌旗下的Github推出的Copilot为例,每年可为其节省开发成本或达百亿美元。
目前,OpenAI、微软、谷歌、亚马逊、华为等都在该领域有所布局。
来源:中信建投,格隆汇整理
其三,图像生成,是除文本模态之外的另一个热门布局领域。目前,海外以OpenAI的Dall·E 2、Midjourney、Stable Diffusion代表,国内主要产品包括百度的文心一格、美图的美图秀秀、万兴科技的万兴AI绘画、毛线球科技的6pen、映刻科技的清墨社区等等。
当然,除了文本和图像之外,音频、视频及跨模态生成等都属于AIGC的范畴,跨模态发展被视为AIGC未来的主流趋势之一。但若以技术的成熟度、配套的数
据和商业路径而论,文本、图像生成类目前已走在前列,Midjourney、ChatGPT相继出圈,更是直接为跟随者打了个样。与此同时,由于参与者越多,ChatGPT等依托的模型进化的速度也会越快。相比而言,AIGC在视频和动画领域的发展相对落后,目前被认为仍存在连贯性和逻辑性的问题。
其四,智能客服,被视为ChatGPT良好的落地场景,有望在to C的场景中率先落地的应用,相比目前的智能客服,ChatGPT支撑的客服将在灵活性与人性化服务方面有显著的进步。近两年来,国内一级市场中也涌现出大量智能客服公司。根据佛若斯特沙利文发布的《2021年中国智能客服市场报告》显示,2020年中国智能客服行业投融资事件有23件,投资总金额为34.4亿元,同比增长123%;2021年上半年,该领域投融资事件有13件,投资金额达23.4亿元,其中一半是C轮至D轮,可见各细分赛道企业渐趋成熟。其中,智齿科技、来也科技、乐言科技、Udesk、晓多科技、小能科技等智能客服厂商,颇受资本市场青睐。
目前,ChatGPT更多是海外的狂欢,国内尚未出现一款类似的爆款应用,但基于产业升级和自主可控的大背景之下,寻找中国自己的ChatGPT-like投资机会无疑是合理且令人期待的。当然,除了上述所提及的AIGC企业之外,目前主要还有以下几类值得关注:
一是以阿里巴巴、华为、腾讯及百度为代表的基础云厂商,具备做出通用ChatGPT的能力,既受益于AIGC快速发展所带来的算力需求增长,也有着足够的数据和算力,来继续推动大模型的优化及落地。
二是以科大讯飞为代表的AI算法领先企业。科大讯飞为机构普遍看好,并被视为计算机板块中最有可能做出通用ChatGPT的公司之一。因为国情不同,其在国内可作为关键基础设施的通用型ChatGPT,在除了互联网巨头之外也有广阔的发展空间。
三是拥有天然的场景应用及配套数据优势的互联网平台。例如,国内最大的在线问答社区---知乎。在该内容社区中,问题被视作起点,由此引发的讨论和答案,是知乎内容的核心,这与ChatGPT这类基于对话模式,以问答类任务为主的效率工具可以说是天然契合,尤其是知乎长期以来所形成的良好知识分享环境和社区氛围。
另外,高价值内容数据的集合是做好ChatGPT这种大模型的核心之一,ChatGPT的优异表现也是建立在庞大数据量的训练基础上,并通过引入“手动标注数据+强化学习”(RLHF,从人的反馈进行强化学习)来不断调整预训练语言模型,大幅提升ChatGPT对人类意图的理解,从而提升回答信息的准确性。
凭借多年对于高质量内容的深耕细作,知乎在数据方面的优势亦可想而知。根据其2022年第三季度财报数据显示,知乎社区内的内容量已累计超5.79亿条,问答量累计超4.82亿条。此外,包括海量的用户点赞互动等投票数据,这既是对内容质量的一种筛选,同时也对于AIGC大模型的开发也是一种天然优势。
这也为其迈入智能化新阶段奠定了基础。除了将极大地提升内容生产和问答的效率之外,高频互动模式下对于用户粘性的增强和产品的进化,想必都是令人关注和可以期待的。
此外,ChatGPT带来惊喜和风光的同时,也制造出了一些焦虑和麻烦。例如,在教育出版行业,目前已有数千种科学期刊明令禁止或限制投稿人使用ChatGPT撰写编辑论文。
目前业内对此一致的谨慎态度,主要在于对AI数据的可靠性和实验成果的质量的担忧。这反倒也让我们进一步看到了像知乎这类本身有着庞大内容数据库平台的优势。 无论是算法的迭代还是AI发展,内容数据库本身的价值,仍然是一个平台进化的重要基础。
回归产业发展趋势来看,AIGC被认为是继PGC、UGC之后的一种新型的内容供应范式,不论是“打辅助”,还是最终“独当一面”,本质上都是一场效率革命。归根结底,都在于技术平替人力。也就是说,人力成本占比较高的行业/企业降本增效的潜力理论上也会比较大。
目前来看,除了典型的劳动力密集型行业之外,重技术研发的软件、制作/版权成本占比较高的内容制作等领域理应有更大的可优化空间。前者例如游戏行业,后者包括影视、传媒等典型内容行业的制作,其中以爱奇艺为代表的长视频平台内容成本占比高达七成左右,而以腾讯音乐为代表的音乐流媒体平台服务成本也占到了约六成(其中主要为内容成本)。
由于当前AI在图像、音乐生成领域相对较为成熟,而在视频类(直播/剧集/电影/综艺)的技术发展相对缓慢,所以图像、音乐类内容产业链有望率先受益于生成式AI技术的发展和应用。
不论是ChatGPT现有的丰富使用场景,还是AIGC广泛的应用场景,其想象空间显然远不止于此。同样,其背后的大模型算法的应用边界,想必也远不止于此。
凭借AI魔法,AIGC正实实在在地影响着这个世界。例如,ChatGPT已经影响到现有互联网大厂的布局,尤其是传统搜索引擎领域。
伴随AIGC技术的发展,其极大的市场潜力也开始凸显,并获投资人看好。红杉资本认为,ChatGPT这类生成式AI工具,让机器开始大规模涉足知识类和创造性工作,这涉及数十亿人的工作,并预计未来将产生数万亿美元的经济价值。
同时,AIGC产业生态也已初现雏形。据《AIGC发展趋势报告2023:迎接人工智能的下一个时代》报告,目前AIGC产业生态已经覆盖基础层、中间层、应用层。
该报告也指出,AIGC的商业化应用将快速成熟,市场规模会迅速壮大。在广告领域,腾讯混元AI大模型能够支持广告智能制作,即利用AIGC将广告文案自动生成为广告视频,大大降低了广告视频制作成本。巨大的应用前景将带来市场规模的快速增长。
以数字内容营销为例,据业内人士认为,AIGC将彻底颠覆现有的内容生产模式,以十分之一的成本,实现百倍千倍的内容生产速度,对数字内容营销领域产生深远的影响。
期待很丰满,但也难掩“现实”骨感的一面。
尽管AIGC潜力巨大,但在技术和商业方面、道德伦理和法规层面,仍面临着客观的问题和挑战。
比如在技术上,ChatGPT仍然还不够聪明。当你打开ChatGPT的对话框,就会发现首页写着“对2021年后的世界和事件了解有限”,偶尔还会产生不正确的信息,有时会编造文献,也会给出错误虚假的答案。
AIGC内容质量仍然取决于算法、算力和数据,其中大模型、高算力和大数据是共识。根据业内普遍看法,相比海外以OpenAI和DeepMind为代表的AI厂商,国内不论是在算力、算法还是高质量的数据方面,都存在着一定的差距。尤其是ChatGPT的成功,再次印证了大模型路线和早期开源的意义。
目前,国内的巨头也这些方向上持续发力。例如,抖音集团旗下的火山引擎、阿里达摩院相继开源适配大模型的专业训练框架平台,针对大模型算法结构和数据参数量,利用分布式策略大幅降低训练时间和成本。
可想而知,不论是大模型还是走向开源,都需要极大的算力基础来支撑。
以ChatGPT为例,据悉,其作为GPT3.5的微调版,训练使用了微软专门建设的AI计算系统,由1万个V100 GPU组成的高性能网络集群,总算力消耗约3640 PF-days。也就是说,假如每秒计算一千万亿次,则需要计算3640天,将近十年之久。
近期,来自十二个国内外研究机构共同发表的一篇关于智能计算的论文中指出,AI模型所需算力每100天就要翻一倍,远超摩尔定律(集成电路上可容纳的晶体管数目,约每隔两年便会增加一倍),也就是说,预计在未来五年内将增加超过100万倍。随着传统摩尔定律的失效,要跟上如此快速增长的计算能力要求,的确是一件很有挑战性的事。
另外,尽管ChatGPT推出付费订阅版进入商业化阶段,但AIGC的商业化之路尚处于摸索阶段,目前仍以B端为主。浙商证券研报指出,B端变现路径更为多元、成熟,广告和营销等行业均有可想见的应用情景,付费的可能性和水平相对更高。
不论怎样,在一直遵循着阶跃式的发展规律的信息技术领域,至少ChatGPT又打开了一个新窗口,将AI产业带入到一个全新阶段,同时也将加剧虚拟和现实世界的连接和交互。
诚然,ChatGPT打开了AI和投资世界的新风口,且热度持续不减。
AI一直被视为一把双刃剑,作为象征着科技进步,其有着迷人的魅力,无不令人着迷,但其所带来的伦理和社会治理等及其他未知的风险和潜在挑战,也不得不令人敬畏和警惕。
那么,更长远的发展视角来看,此次开启的究竟是宝箱,还是魔盒?不得而知。未雨绸缪作为人类朴素且有用的智慧,在面对未知的风险面前,或许,依然奏效。
本文来自微信公众号 “格隆汇APP”(ID:hkguruclub),作者:贝尔席,36氪经授权发布。