2023年开年,ChatGPT顶替元宇宙的地位,从技术圈成功破圈,站上了C位。它验证了AI算法是可落地的,给了AI、互联网等领域新的故事,有了新的想象空间,在当下很难说这种现象的好坏。
关于ChatGPT的技术架构和实现方式,公开资料已经很多,就不再班门弄斧的赘述了。在这里,会从价值和问题的角度出发,尝试去拨开ChatGPT的迷雾,尽力去找出真相。
从发展上看,ChatGPT既重要也不重要。
重要的是,它不仅是AIGC方向的重大突破,在应用层上的亮眼表现也成功做出AI领域2C方向的表率,消除了社会对AI应用和商业化的疑虑;不重要的是,ChatGPT并不是AI革命,只是模型和场景应用的一次飞跃,底层三要素(算法、算力、数据)没有改变,且当前尚存在诸多问题,例如数据集的限制,投入产出比远不合理,单独的ChatGPT仅覆盖文字和图片,无法适用于多模态信息,更不用说跨模态生成,不仅难以推动社会整体发展,甚至有可能造成社会混乱。
最大的价值在于,它向一直找不到2C场景并逐渐对2C方向失望的AI从业者们证明了,奇点已到,AI已经可以和人类展开有效互动了。
ChatGPT能够理解的人类意图,产生有效互动,依旧离不开数据、算力、算法、模型、场景等五个要素,这次主要是在模型和场景上做出突破。
ChatGPT通过以机器学习、神经网络等为主的算法,以及Transformer模型的多种技术模型积累,得以在文字/图片交互上极大提升了用户的对话体验。在对话中,ChatGPT会主动记忆对话内容信息,实现上下文理解,用于辅助假设性的问题的回复,进而实现连续对话。简单讲,会在对话中,通过Transformer预测下一个词语/短语的概率分布,并基于在大型文本语料库上学习到的语言模式来生成自然语言文本,最终实现一问一答的交互。在此过程中,将人类的反馈纳入模型训练过程,更好地使模型输出与用户意图保持一致。
2月11日,斯坦福大学计算机科学家米哈尔·科辛斯基(Michal Kosinski)在一篇名为《心智理论可能从大语言模型中自发涌现》的论文中,通过心智理论的验证,证明ChatGPT已经有9岁孩子的心智,这标志着AI已经进入一个崭新阶段。
数据集的局限性导致AGI只是走出关键一步,远未成熟。模型数据集的来源是维基百科、书籍、期刊、Reddit链接、Common Crawl以及其他数据集(如论坛对话、视频字幕等),只包括了人类创作的部分数据,以文字为主,尚未涉及其它模态数据,更不用说非人类创作的数据了。以此种数据集为根,结果大概率会出现偏见。
ChatGPT答非所问、似是而非的回答层出不穷,目前只能作为娱乐使用,远达不到工具层次,更不用说替代人类了。
从生成结果看,ChatGPT得出的结论更多是按照一定逻辑的信息重新组合,没有实现知识创造,这必然会引发一系列问题,如知识产权、剽窃抄袭等。从产品角度来看,用户仅是因为尝鲜而使用,使用粘性和使用生命周期有待商榷。很难想象,如果用户主动使用ChatGPT后,会完全信任它给出的结论,使用这些结论去做决策。
将对社会稳定造成极大影响。
对于处在“信息鸿沟”中的人群而言,ChatGPT的答案泛滥并不是什么好事情,安全隐私受到冲击、谣言层出不穷、欺诈难以监管、信任不在、信念动摇等现象大概率会出现。
在新的商业模式未出现的时候,当前商业模式会受到冲击。
当前的商业模式建立在价值流的基础上,即价值生产流向价值消费,其中价值生产的稀缺性,提升了价值从生产到消费的势能,推动了商业发展。但ChatGPT的出现,使价值生产,尤其是信息的价值生产大众化,降低了价值生产到消费之间的势能,导致价值流动形成新方式,从而影响旧方式下的商业模式。
例如,当用户在搜索页面可以直接获取精准结果时,搜索所建立的竞价排名将会无用武之地,如果广告进入生成式AI,那么不仅需要从数据集开始进行改变,模型也需要相应调整,当进入的品牌达到一定规模的时候,结果混乱将随之产生。
生成式AI的模型黑盒可能会使人类失去对AI的控制。对比人类学习,人类学习的路径是清晰的,可干预、可测量、可考核的,换句话说,在人类的学习上,过程是可控的。但是对于生成式AI,我们尚不清楚它们的学习机制和过程,也就难以把握它们的学习最终结果。
根据UBS分析师Timothy Arcuri的观点,ChatGPT使用到了至少1万块英伟达的GPU来运营这一模型。而一张40GB的A100 PCIe卡,目前在亚马逊上的单价为8000多美元,而80GB的A100 PCIe卡价格在15000美元左右浮动。根据Semianalysis分析师Dylan Patel的推算,如果只负责在服务器上部署ChatGPT的OpenAI无需考虑设备购入成本,而是只考虑GPU云服务器的定价。ChatGPT每次查询的成本为0.36美分,约合2.4分人民币,每天在硬件推理上的成本高达70万美元。
从2022年ChatGPT的公开数据来看,年总支出在5.44亿美元,375名员工的工资2亿美元,GPT3的训练成本在460万美元/次。如果考虑到未来音频、视频等多模态数据的进入,那么成本还会大幅增长。
考虑到当前存在的技术问题,它们的发展方向有可能如下几种:
一是数据会延伸到更多模态,二是将囊括环境及机器产生的数据,以环境数据为基础提供答案,或实现机器之间的交互,三是ChatGPT自我产生的数据进入数据集,形成自闭环,开始具备知识创造能力,不断提升AI的学习能力。
先对垂直领域的各维度各模态数据进行整合,针对垂直领域特征进行模型调教,在垂直领域中实现AI工具化。而后连接各垂直领域,逐渐实现通用化。
包括数据成本、算力成本、训练成本等。
生成式AI将会率先赋能生产型企业,在客服、广告方向提升效率。而对于平台型企业来讲,需要打造生成式AI能力,并赋予生产型企业更强的能力,降低企业成本,在平台上价值势能降低的情况下,提升价值流动的动能,为平台上的用户提供更有效的价值消费。
目前来看非常困难。在追赶的这条道路上,资金反而是最不重要的因素。从云到LLM模型,到平台层,再到应用层,国内还有很漫长的道路要走。
从时间上看,2015年OpenAI成立,2018年推出GPT-1,2020年推出GPT-3,2022年ChatGPT上市,期间经过将近8年。即使AI三要素没有突破,随着规模应用,训练成本大幅降低,国内想在短时间内在模型上追齐国外,困难程度不可谓不大。而且,算力还是被卡脖子之一,算法也难以做出突破。
最重要的是,国内的内容数据集规模上存在短板,质量上参差不齐。
从规模上看,国内的用户主动生成的内容数据还不能与海外相比,尤其在文字上,原创的知识类内容占比不高。
从质量上看,优质内容、内容维度、内容标注等方面还有缺陷,以致使用模型效果不佳。
完备数据集、超强算力、优秀的算法是根本,模型开发能力和调教能力是突破口,场景应用是表象。
有扎实根基,有突破欲望的企业才能有可能经过长时间蛰伏,与海外一较高下。只拿应用场景说事儿,而忽视根基的打造和突破的决心,最大的可能是一地鸡毛。
另外,企业对于LLM模型的定位和目标也是必要因素之一。如果不能持之以恒,确立明确方向,做出有效规划和风险规避手段,仅希望短时间内就能产生商业化价值,形成卖点,赚个吆喝,那么所谓的弯道超车仅是个市场营销手段罢了。
但是,借助ChatGPT的能力,在应用层上进行包装后的商业化,则存在极大可能,这也是中国企业擅长的领域。
例如,ChatGPT与数字人结合,陪伴用户或协助用户解决问题;赋能更多有创作天分的用户,来生产更多内容等等。尽管如此,还是衷心希望我国有更多企业能够锚定根技术,形成我们自己的技术壁垒,推动我国AI的发展,不断提高AI生产力。
本文来自微信公众号“新生代市场监测机构”(ID:sinomonitor),36氪经授权发布。