文|硅星闻,作者|邵旭辉
GTC后,生成式AI相关的讨论久久不能平息,上个月Gen AI领域刚刚宣布的两个高额融资消息也引发了大量关注:Augment以近10亿美金的估值融资2.27亿美金,Cognition则以20亿美金估值融资1.75亿美金。从文字chatbot到视频生成、机器人,生成式AI的能力不断拓展,应用潮已经开始,行业内外,大家都很关心这个话题:AI将会带我们到何处去?
作为AI、深度学习领域多年的从业者,曾经的大公司管理者、创业者以及如今的深科技领域投资人,我在此抛砖引玉,谈谈我对生成式AI发展的个人判断。
本质上,我认为生成式AI的竞争力根植于这三个维度:
一是算力及基础设施,这也是许多大公司优势明显的地方。
二是算法,当然也意味着算法背后的人才。
第三则是数据及应用场景,对创业公司来说,这一部分仍存在着大量机遇。
我们下面可以从这三个维度来生成式AI的未来。
Gen AI并非算力竞赛,创业公司的机会在这些领域
在算力方面,Nvidia是GPU的领头羊、CUDA生态的开创者,具有巨大的优势,但其实,未来的生成式AI并非绝对以算力定成败。
算力有限的创业公司或者科研机构,机遇主要在哪里呢?
首先,创业公司可以打造生成式AI的基础设施,解决底层的问题。
几乎所有的领域的公司,都在考虑自身在生成式AI方面的竞争策略。在数据隐私/计算安全、
准确性/可靠性、商业逻辑等等领域都会有很碎片化的的要求。而大厂的工具链服务链只能解决一部分需求,其他的就需要初创企业来填补。Lepton.AI、Corvic.AI、Fairly.AI 等都属于这个范畴。这些创业企业搭建了机器学习领域的基础架构,比如Corvic.AI,他们提供的解决方案让复杂数据能较为简便地转化为可用的企业级AI,提供预测分析、AI助手、数据标签等功能。
其次,虽然大公司在算力方面拥有优势,创业公司可以将目光投向专业领域——对于这些领域来说,持续积累的专业数据将会有着不可替代的价值,其中的行业壁垒、合规等方面的积累也能形成一定的护城河。
而更重要的是,不少领域(比如生物医药、网络安全、科研、制造)的底层逻辑和大模型擅长的语言文字视频并不相近,无法直接套用,也不容易简单的做二次开发就能获得好的结果。
从另一个角度来说,大模型也同样打开了许多新机遇,过去一些离商业化较远的领域可能忽然就有前进的动力了,其中往往会有创业公司的机会。
文初提到的AI写代码就是一个新出现的机遇,这两家企业都是近年来发展迅速的AI公司,Cognition的创立时间才刚刚半年。我们也投资了一个同类别的公司Metabob,通过AI来帮助人们找程序中的bug并修复它们。这类企业在AI与软件工程的交叉点找到了自己的市场。
近期机器人的热潮也是个很好的例子。
过去传统机器人往往只能解决单个任务,机器人的传感器、成本投入都有限,也限制了它的发展。
随着LLM的发展,机器人能够在虚拟空间通过强化学习(reinforcement learning)来进行学习、迭代、完成复杂任务,带来了一系列连锁反应——企业愿意开发拥有成本更高、能力更强机器人,这一行业也有了更多的想象空间与投入。斯坦福大学李飞飞教授参与的团队也构建了类似于当年ImageNet的针对虚拟空间训练测试机器人的基于物理模型的大规模训练场景。
今年3月,机器人公司Figure与OpenAI合作发布的视频引发了很多关注:金属覆身的机器人接入了OpenAI的大语言模型,能够迅速理解人类的意图并做出相应的动作,包括整理、准确放置物品以及完成一些相对模糊的指令——一名男子对Figure01“给我找个吃的”,机器人略思索后,拿起了桌上的苹果,并递给了他。值得注意的是,桌上还有四散的碗盘、沥水架等,苹果是唯一一个可食用的物品,这个简单的动作涉及了推理与思考过程,加上之前整理、收纳,机器人展现了完成多个复杂任务的能力。
除了Figure01外,ChatGPT引领的大模型风潮下,各类引入了LLM的机器人正在涌现:University of Michigan的学者也发布了基于大语言模型,能够更好地理解3D环境的家用机器人。在工业、农业、医疗等领域,可以想象,新型的 机器人会带来很多的新变化。
新型芯片及算法可能会重写垄断格局
目前,在生成式AI的算法方面,呈现NVidia、OpenAI、Microsoft三巨头垄断的格局。不过在我看来,这样的情况也会在技术进展下面临变化。
这并非我一家之言,可以说,几乎是一个行业共识,只是很难预测它具体的时间点。
今年GTC上,Transformer的原作小组首次聚集,八位作者中的七位与黄仁勋对话,而核心观点就是:Transformer已经够老了,期待看到更新的模型。
作者之一、Cohere的创始人及CEO Gomez评论道:我想看到比Transformer好十倍的模型来替代它……Transformer在内存占用和许多架构方面都有优化的可能性,比如一个非常长的context是很昂贵、无法扩展的,它的parameterization可能不必要那么长 ,我们可以压缩许多倍,带来指数级的缩小。
从仿生学的角度来说,这个观点也很站得住脚——目前算法的功耗算力,跟自然界还有很大差距。
人的大脑功耗几十瓦。昆虫的大脑功耗是毫瓦/微瓦级的,神经元数量极少,也能完成特别复杂的立体视觉、三维控制、捕猎逃生等感知相关的行为。同等情况下,如果让电脑复现小动物在自然界里识别、控制、捕猎、求生的能力,需要更先进的模型,也一定会逐步出现更先进的模型。
而未来更好的算法与模型也很可能意味着更多专用的、小型的芯片会迎来发展。
比如我们此前投资的D-matrix,主打存内计算,预计将在2024大规模量产,目前已经有大量订单。另一个模拟计算芯片设计企业Tetramem也备受关注,已经发布了多篇Nature论文。
除此之外,开源的相对小型的transformer 模型(如Microsoft's PHI-2 and Mistral 7B)也会迎来快速发展。在我看来,这些开源的小模型对于AI行业持续、健康的发展是很有必要的。这次AI的热潮与以往的科技潮不同,大公司并未占据所有重要的研究方向——谷歌上市时,许多大学就停止了对搜索算法的研究,因为谷歌已经有了很好的团队和资源来推进搜索算法。而生成式AI则不是,对于研究机构而言,这些开源的小模型中还有很多值得探索的地方,目前所有名校的计算机系也都在积极研究开源模型。
甚至可以说,文初我提到的、未来我们期待的新的算法很可能就会从这些科研人员的工作中涌现。
GenAI发展的背后是人才之争
这个对更新、更好的生成式AI算法的期待,也意味着另一件事:生成式AI的竞争也意味着人才之争。
目前,中美是在AI人才方面占据全球一二位置的两个国家。
从绝对人数来说,中国占据了第一位——今年三月,纽约时报报道了一个追踪AI相关人才的报告,中国有着全世界最多的AI本科生人才,而与三年前相比,如今在美国的顶级AI人才中,中国人的比例也已经超过了美国人。比起过去,这些中国人才在美攻读学位后,也更多地“回流”中国。
当然,美国有着世界数量最多的一流大学,与创新气氛浓厚的科技企业,也孕育出了将LLM石破天惊带入大众视野的Open AI,对各国的AI人才仍旧有着强烈的吸引力。
不可否认,基于天时地利人和等方面考虑,中美牢牢占据了未来AI发展综合最优的前二宝座。
在这个背景下,还有一个值得注意的趋势:人才的两极分化。
由于AI+ 的杠杆作用越发明显,创立一个优秀的AI企业所需要的技术人才的数量比几年前已经显著减少了。企业接下来对人才的竞争,会越来越集中于少数顶尖人才的争夺。
无论在硅谷还是在北上杭,我们已经看到顶级AI人才被高价争抢,而普通大学生找不到工作的这种两极分化,而这样的趋势未来也会更加明显。
Gen AI将成万亿美元市场,投资人如何入局?
从我和我身边的创投从业者的角度看来,我们的共识是Gen AI的未来是光明的——Bloomberg Intelligence报告预测,GenAI将成为未来十年发最迅速的市场之一,市场总量超过万亿美元,复合年增长率超过40%。它变革性的能力会影响各行各业。
对于投资人而言,如果想要投资这个市场,我有以下建议:
首先,投资生成式AI项目,本质上仍旧是在深科技技术中寻找那些具有商业化潜力的项目。投资人最好能具备AI相关技术背景,并且保持持续学习及市场敏锐度。目前生成式AI的技术变化、突破、市场都在迅速发展。比如此前一些挂着大模型名号的项目,也许在ChatGPT某次更新后就会完全失去市场,能够识别这些项目,可以帮助规避许多风险。
其次,正如文初分析的,目前生成式AI的支柱分为人才/算法、算力、应用/数据三大方向。作为投资人,前两者的投资难度较大,然而应用/数据中,有着大量的未来机遇,可以考虑投资一些相关资源。
比如应用场景和应用场景相关的数据——对于中国投资人来说,半导体 、新能源、先进制造都是不错的方向。以制造业为例,拥有大量垂直行业内的数据,才能做出好的AI,指导未来的先进制造。
从时间上来看,技术上如果不能特别确定 ,也可以等一下商业落地的信息,付出一些增值成本来换取更稳定的信号。
有关AI,这个问题我常听到:AI能最终代替人类吗?
我认为这要从不同尺度上去理解——我们究竟在讨论的是AI从什么程度上在挑战人类进化?如果是生物体层面,这有着百万年以上的积累,是最难的;从人类认知层面,也至少有10万年进化横亘在AI面前;而出现数千年的人类语言相对更容易;出现仅100年的计算机语言则最简单。
这个问题的答案当然没有定论。不过在这个最终将达万亿美元、改变人类生活的市场里,我很期待看到更多来自华人参与者的身影,不管是创业、投资,还是积极地拥抱生成式AI让生活、工作变得更高效,它将前所未有地改变我们与世界交互的方式。