近期在研究ChatGPT大叙事之下涌现的新的创业机会时,偶然发现了Leonis Capital风险投资基金Jenny Xiao (肖文泉)和Jay Zhao所撰写的《China’s Generative AI Landscape and How It Compares to the U.S.》深度剖析了中、美在人工智能格局发展差异的根本原因,未来发展路线的差异化,以及ChatGPT浪潮之下催生的AI生成式创新机会。笔者在此借助GPT-4快速翻译了这篇文章,希望能够给大家也带来最新的思考和启发。
当硅谷的投资者和创始人对生成式人工智能感到兴奋之际,同样的生成式人工智能狂热也席卷了中国的同行。关于ChatGPT、DALLE-2和Stable Diffusion的新闻几乎同时传遍 了西方科技社区和北京。
然而,在西方鲜为人知的是,中国正在建立自己的生成式人工智能平行世界。中国的科技巨头们正在构建与OpenAI的ChatGPT和DeepMind的AlphaFold类似的模型,而中国的创业社区也逐渐察觉到了这项新技术所带来的巨大机遇。
虽然美国的科技人员通常对于发生在硅谷以外的事情毫不知情,但政治评论员迅速声称中国在人工智能实施方面“领先于美国”,并且中美之间将出现一场“生成式人工智能军备竞赛”。
那么,中国的生成式人工智能领域到底发生了什么?它对世界其他地区有何意义?
ChatGPT发布一周内,中国科技界关于这个新聊天机器人的消息纷纷传开。科学家开始讨论人工智能何时能通过图灵测试,科技社区开始质疑ChatGPT是否能挑战谷歌,投资者则对生成式人工智能成为下一个万亿美元产业感到兴奋。
半年前,在2022年度百度世界大会上,百度的创始人兼首席执行官李彦宏提出了一个新的市场概念:“AI生成内容”(AIGC)。他在主题演讲中强调,在未来十年,“AIGC将颠覆所有现有的内容制作模式。”他相信,AIGC有可能将原创内容制作的成本降低到当前的十分之一,并将制作过程加速数百甚至数千倍。
然而,西方实验室发布强大的人工智能模型也引发了中国科技界的警钟。针对OpenAI发布ChatGPT的反应,中国观察家表达了对国家在技术领域的“落后感”的担忧。这些API受到少数西方公司的控制,进一步加剧了中国新兴创业公司的焦虑情绪。
随着ChatGPT和Stable Diffusion席卷全球,中国实验室发布的生成式人工智能模型受到的关注要少得多。然而,中国的科技巨头和该国最优秀的人工智能科学家正在不懈努力地构建相同的模型。事实上,中国似乎是除美英垄断之外,唯一一个自行开发自己模型基础设施的国家。
除了像Google、OpenAI和Meta这样的生成式人工智能领域的知名参与者之外,就模型数量而言,排名前十的开发者中有四家位于中国。其中包括百度和阿里巴巴等科技巨头、清华大学等顶尖大学,以及北京人工智能研究院(BAAI)等政府赞助的实验室。
虽然以色列的AI21实验室和加拿大的初创企业Cohere也在构建大规模模型,但除美英之外,中国是唯一一个建立和发布这些模型的多个实验室的国家。中国还建立了自己的人工智能框架,包括华为的Mindspore和百度的PaddlePaddle。这些框架与主流的西方框架(如PyTorch和TensorFlow)不兼容,但有像Ivy这样的转换工具可以在这些框架之间搭建桥梁。
除了模型训练基础设施外,中国的开发者在硬件层面上也越来越独立。为了应对美国制裁的威胁,中国公司越来越多地转向国产GPU,如华为的Ascend 910,这些GPU帮助训练了PanGu-α和ERNIE 3.0 Titan等生成式人工智能模型。这些努力为发展蓬勃的生成式人工智能生态系统奠定了基础。
在模型参数数量(模型性能的粗略代表)方面,中国模型比西方顶级模型落后大约一年。与“来自中国的更大、更强、更快的人工智能”的说法相反,中国在模型大小和性能上落后于西方。而且中国很难在短时间内超越美国,主要是因为顶尖人工智能人才的差距。中国实验室非常善于学习西方领先实验室的进步,但在提出原创模型和推动研究边界方面能力不足。因此,在一段时间内,中国在生成式人工智能模型领域可能仍将紧随其后。
在西方发布开源模型的情况下,中国开发者也能够绕过昂贵的开发需求,并迅速将现有模型适应到中文语境中。在Stable Diffusion发布几个月后,中国的研究团队IDEA-CCNL迅速训练并发布了Stable Diffusion的中文版本(称为Taiyi-Stable Diffusion)。该模型在捕捉中国文化背景方面表现得更好。
“铁马冰河入梦来”3D绘画(宋代诗人陆游的诗句)
“水飞流三千尺”油画(唐代诗人李白诗句)
在应用层面上,中国的发展也落后于硅谷的初创企业生态系统。这再次挑战了中国在人工智能实施方面领先于美国的观点。如果你将我们的中国市场地图与之前的硅谷市场地图进行比较,你会发现在中国还有许多垂直领域尚未发展起来。例如,在中国建设开发者工具和提供编码帮助的生成式人工智能公司很少。这可能是一个完全由西方公司主导的领域,因为在开发者工具市场中存在较少的文化、语言和政策障碍。
即使在现有的垂直领域中,中国的参与者也相对较少。中国的文本生成、图像生成和音频生成初创企业的发展水平需要时间才能达到西方的水平,并且可能难以找到足够大的市场。这是因为大部分西方的文本生成和图像生成初创企业是面向企业的公司,而中国的B2B市场规模要小得多。
这意味着中国的生成式人工智能领域更像是一个竞争对手较少、市场动态迅速发展、甚至可能存在更多初创企业和投资机会的蓝海。难怪中国的科技巨头和顶级风投基金密切关注着该国的生成式人工智能领域。
然而,中国的企业市场发展程度相比美国市场,企业不愿意为软件付费,更习惯于支付服务费用。我们可能会看到中国的人工智能公司创造出一种本质上是“服务为先,人工智能软件为后”的商业模式。这些公司的行为可能与传统的SaaS公司有所不同。
与美国拥有强大的水平SaaS市场不同,中国的人工智能公司更适合深入发展,为少数几个大型行业提供服务,而不是广泛针对SaaS市场。在一些领域,中国领先于美国,包括电子商务、短视频制作,也可能包括游戏。事实上,我们已经看到中国的生成式人工智能公司进入了这些领域。Fancy Technology,一家人工智能视频生成平台,专门针对电子商务企业。
由于文化障碍和政策限制,西方科技初创企业越来越放弃中国市场。在中国,可能会出现平行的生成式人工智能领域,国内公司彼此竞争,并相对独立于硅谷的同行公司。
然而,与其他领域类似,“复制到中国”的简单模式通常不起作用。在西方,基于文本的人工智能写作和营销工具是最受欢迎的生成式人工智能公司类型,但在中国这类工具相对较少。中国公司较小的销售和营销预算对商业化构成挑战。高质量的中文语言训练数据的稀缺性对高性能语言模型的发展构成了瓶颈。更广泛使用基于视频的营销意味着基于文本内容的用例更为有限。
相反,中国正在开发自己的生成式人工智能应用领域。在基于文本内容创建工具方面,与销售和营销相关不同,许多产品提供普通和学术写作支持以及翻译。受欢迎的人工智能写作工具 Pitaya 专注于提供学术写作辅助和英语翻译服务。这是因为中国庞大的学生群体常常在英语和学术写作方面遇到困难,而中国面向全球的公司需要员工与外国同行用英语进行沟通。
此外,一些中国基于文本的产品针对特定用例甚至更为狭窄的垂直领域。另一家领先的自然语言处理(NLP)初创企业“澜舟”专注于金融文本分析。它使中国金融机构能够从成千上万页的会议记录、合同和市场报告中快速提取关键数据点。尽管中国的通用型人工智能模型仍落后于世界领先模型,但构建具有大量领域数据的垂直特定模型通常弥补了性能差距,并产生更好的实际应用结果。
在中国,生成式人工智能中发展最迅速的领域之一是AI视频生成,尤其是数字人和电子商务视频营销。与西方的AI人物形象和数字人初创企业倾向于追求性能不同,中国公司更加注重其形象的娱乐价值。只需比较位于伦敦的AI视频初创企业Synthesia创建的AI人物形象与中国的小冰生成的AI员工崔筱盼即可看出。Synthesia的人物形象看起来像你日常生活中的商务人士,而小冰的人物形象崔筱盼看起来像是一位韩流偶像。
Synthesia 创建的 AI 头像
小冰AI员工崔筱盼荣获2021年万科“年度最佳新员工”
数字人物和AI形象在中国的媒体、娱乐和电商行业中也被广泛使用。一个原因是这些AI形象具有更高的娱乐价值,它们外观更好,它们的创作者对媒体和娱乐有更好的理解。因此,消费者更愿意接受AI恋人、电视主持人和TikTok营销人员的存在。
中国滑雪运动员谷爱玲的人工智能头像,由数字媒体公司咪咕创建
另一个原因是中国的电子商务领域更加注重视频而不是文本或图像。中国有一个庞大的视频营销行业,企业通过直播和短视频来销售他们的产品(请记住,中国是极其受欢迎的短视频应用TikTok的发源地)。如果中国的一些AI视频初创企业取得突破并在全球范围内成为主导者,那将不足为奇。
然而,与西方的同行一样,中国的生成式人工智能初创企业面临着相同的挑战,包括寻找适合应用的技术难题以及长期商业化和盈利化问题。例如,中国已经有许多AI图像生成应用程序,但很少有建立可行商业模式的。大多数应用更像玩具而不是实用工具,一旦用户习惯了这项技术,它们很可能会失去用户的关注。商业化问题经常出现在中国投资者对生成式人工智能未来前景的讨论中。
谈论硅谷初创企业在全球市场的计划是很正常的。但一提到中国企业的海外扩张,往往会引发西方观察者的警惕。然而,对中国初创企业来说,扩张海外是一个自然的步骤,随着中国的初创企业成熟,这种情况会越来越多见。随着中国科技行业的发展,更多的企业将从一开始就面向全球市场。
这些中国初创企业中,许多进入的是西方企业未充分满足的市场。AI语音助手初创企业AI Rudder主要面向东南亚市场,提供近20种不同语言和当地方言的产品。该公司最初在上海成立,很快在新加坡设立了办事处,以服务东南亚市场。
AI时尚初创企业ZMO.ai也在中国创立,并获得了来自高瓴资本和GGV Ventures等顶级中国风险投资基金的资助。该公司已在美国和加拿大设立办事处,并进入北美市场。该公司为全球时尚品牌创建AI模型。
ZMO.ai 生成的 AI 模型图像
一方面,中国的生成式人工智能公司希望进军全球市场,这是因为中国的B2B业务面临一些挑战。这在很大程度上是因为中国公司对软件付费的意愿较低,因为在中国劳动力成本仍然较低。另一方面,具有中国背景的创始人很可能希望将他们的工程团队保留在中国,以利用中国丰富且具有成本优势的工程人才,就像Zoom和字节跳动所做的那样。
中国政府在监管生成式人工智能方面领先于其西方对应机构。2022年11月,中国国家互联网信息办公室发布了《关于互联网信息服务中深度合成内容管理的规定》,这是一套管理合成内容(包括AI生成的文本、图像和视频)的政策。这些规定于2023年1月生效,并包括风险评估、实名用户注册以及标记AI生成内容等要求。
然而,随着生成式人工智能产品变得越来越流行,其他道德和政策问题可能会出现。目前,AI生成内容处于法律灰色地带,版权和知识产权归属仍不清晰。正如OpenAI的代码生成模型Codex面临一名GitHub开发者的侵权诉讼,西方和中国的AI公司都对知识产权保持更加谨慎。中国的AI艺术生成初创公司TIAMAT确保其模型是使用没有知识产权的数据进行训练的。这一措施也被美国知名的艺术生成应用Midjourney所采用。
分析中国的生成式人工智能领域时,不能忽视美国加强制裁的影响。2022年9月,美国政府禁止顶级芯片制造商Nvidia和AMD向中国销售其最先进的图形处理器(GPU)。许多西方观察家认为,这一举措可能会严重阻碍中国大规模生成式人工智能模型的发展,因为这些模型通常需要大量计算资源进行训练。
然而,这些制裁对应用层面的初创公司的影响相对有限,因为很少有公司使用先进的GPU来训练和部署他们的人工智能模型。即使是百度等中国科技巨头的AI云服务业务,也受影响较小,他们在业务中很少使用受制裁的GPU,并且从长远来看,他们的目标是开发自己的GPU来替代进口产品。Nvidia也为中国市场专门推出了符合规定的GPU,以规避制裁。
受影响的主要是中国依赖先进GPU来训练和扩展模型的基础研究机构。事实上,中国大部分大规模生成式人工智能模型都是在Nvidia GPU上进行训练的,包括大部分BAAI的Wudao 1.0和Wudao 2.0模型、清华大学的多模态CogView模型以及百度的大规模语言模型ERNIE 3.0。
最近,拜登政府正在考虑对美国对华出口投资实施新的控制措施。这些限制的影响将取决于其范围和条件。在美国政府开始考虑对投资实施控制之前,北京已经对美元基金的投资活动实施了限制。尽管这些基金大多数在中国注册,但由于其资本来源于国外,它们在中国的深科技领域几乎被排除在外。美国对对华出口投资的额外限制将进一步加强美国和中国科技生态系统之间的壁垒。
中国的生成式人工智能领域正在快速发展,可能是除了硅谷以外最值得关注的地区。中国是美国和英国以外唯一一个开发完整“生成式人工智能技术栈”的国家,从基础模型到应用层面都有所涉及。由于中国市场在许多方面与西方市场存在很大差异,因此中国的生成式人工智能垂直领域与西方有着很大的不同。与此同时,中国的创业者和投资者面临着与西方同行相同的生成式人工智能挑战,包括构建可持续商业模式和实现先进技术的商业化。中国的开发者还面临着美国的制裁和国内政策限制等额外挑战。
我们目前仍处于中国生成式人工智能生态系统的初期阶段。与移动时代类似,两个生态系统中具有标志性的未来以人工智能为核心的公司将呈现出截然不同的面貌。在美国,这些公司可能会针对传统企业使用案例,得益于该国成熟的B2B软件市场,而在中国,作为一个拥有巨大电商、供应链和消费者行业的国家,我们预计将看到创业者构建具有竞争力的以人工智能为核心的公司,为这些市场提供服务作为起点。
尽管基础研究能力存在技术滞后,并且面临着日益加剧的美中紧张局势的压力,但我们预计中国的市场和人才将继续为本国及其他地区产生令人兴奋的公司。
https://www.leoniscap.com/posts/chinas-generative-ai-landscape
本文来自微信公众号“出海后厂村”(ID:Overseas-tech),翻译:GPT-4,校对:村长,36氪经授权发布。