在最热的风口上一眼望去,千帆竞发。
15日开始,GPT-4、百度的文心一言接连发布。很快,美国时间3 月 16 日早上 8 点,微软宣布旗下商业软件 Microsoft 365 全线接入 GPT-4,并推出一款新 Copilot,旨在帮助人们生成文档、电子邮件、演示文稿等,更是给热度不减的大模型添了把火,围观者对于多模态大模型的商业化想象拓展了一个层级。
两天内三场重磅发布会,巨头们忙着抢占大模型高地,一级市场也没闲着,短短一个月时间,大模型的投融资热度开始飙升。
日前,AI大模型研发的认知智能公司北京澜舟科技宣布近日正式完成了新一轮融资,本轮融资由北京中关村科学城公司领投,斯道资本和创新工场继续跟投。不到一年时间,澜舟科技融资总额达到了数亿元。
简单跟进下近期大模型领域的投融资,可以说是“喜报”频传。
致力于对话机器人行业解决方案的竹间智能完成超亿元D+轮融资;致力于企业创新数智化平台的衔远科技完成数亿元天使轮融资;医疗交互AI平台聆心智能完成Pre-A轮融资;二月底,Tiamat完成近千万美元A轮融资, DCM和绿洲资本联合领投。
时间轴拉到一个月前,ChatGPT热度持续走高,但凡沾上了点概念的股价都一路涨停。
二级市场撒网摸鱼者有之,声浪喧嚣者有之,但一级市场却罕见地保持了观望态度。
但现在我们知道,大模型这场比赛,不管入局者有没有准备好,枪已经响了。
枪响了
3月16日的发布会上,李彦宏表示,已经有超过650家企业接入文心一言。
虽然在产品展示时使用预录制Demo,被戏称为“发布会跟我答辩一样,生怕说多了露馅”,但根据百度提供的数据,发布会后一小时内,排队申请文心一言企业版API调用服务测试的企业用户已达3万多家,到了3月17日,这个数字达到了7.5万,与百度智能云基于文心一言展开合作咨询的信息也已达到了6080条。
这意味着即便相对于GPT-4来说还有许多不足,但是大家都对于大模型倾注了热情,而另一方面也是的确不敢掉队。
之前,前美团联合创始人王慧文朋友圈发布“人工智能宣言”,宣布自己出资5000万美元投身人工智能领域,寻找“业界顶级”、“狂热爱好AI”的技术人才,打造中国版OpenAI。王慧文还称,下轮融资已经有顶级VC认购2.3亿美金。
据多方了解,王慧文口中的“顶级VC”至少包括源码资本、真格基金等。有消息称,源码资本已准备出资1亿美元,源码资本创始合伙人曹毅也在朋友圈表示:“祝贺老王等到了,行业也等到了老王出山”。
而后,昔日并肩多年的好友王兴也决定加入,将以个人身份参与王慧文创业公司“光年之外”的A轮投资,并出任董事。他在朋友圈中表示,“AI大模型让我既兴奋于即将创造出来的巨大生产力,又忧虑它未来对整个世界的冲击。老王和我在创业路上同行近二十年,既然他决心拥抱这次大浪潮,那我必须支持。”
技术的迭代如此之快,以至于任何一个公司都不敢小觑AI的能力,这反映到提供预训练模型的巨头基础层公司和广阔的应用层公司是如此,转向中间层开发垂直化、个性化模型的中小型企业,仍然如此。
从事AI大模型研发的澜舟科技成立于2021年6月,是一家由李开复的创新工场孵化、从事AI大模型研发的认知智能公司。2021年7月,澜舟科技推出的孟子大模型在中文语言理解评测 CLUE 榜单上登顶第一,刷新业界记录,用10亿参数级别的轻量化模型击败其他巨头公司百亿甚至千亿参数级别的模型。
接着的半年内,澜舟科技就拿到了三轮融资,前两轮由由创新工场人工智能工程院和前沿科技基金主导,第三轮Pre-A轮融资金额达到了数亿人民币,由联想创投、斯道资本共同领投。而今年这轮融资,斯道资本也选择了继续加注。
二月底,AI 图像生成技术服务商Tiamat完成近千万美元A轮融资。而前京东AI掌门人周伯文带队的衔远科技也在近日揽获了亿元天使轮投资。
大模型的风,算是越吹越大了。
大算力是入场券吗?
当然,就像观望的投资人所考虑的那样,风浪再大的赛道,拿到入场券的也只会是少数。而什么能够拓展未来的想象空间,或许我们能从这几个企业中窥得一斑。
有人直观地表示了大模型——大数据+大算力+强算法=大模型。确实是大力出奇迹的暴力美学典范。
在GPT4公布前,不少人判断GPT4将是百万亿大模型(之前GPT3.5是1750亿模型)。
但是Altman也亲自下场辟谣,表示GPT-4的参数量不会大很多,但可能会用到更多的计算资源。
技术迭代下追求模型参数和算力的无限大并不是唯一的道路,不管是孟子通用预训练大模型还是Tiamat的MorpherVLM,都在十亿、百亿级别,但是在纵深场景上已经有了一定的优势。
衔远科技创始人周伯文对甲子光年表达过这样的认知:“我并不认为要做到GPT-3的效果,一定需要1750亿模型参数。事实上我们有大量的空间去压缩它。这是我对技术的判断。因为如果我们不做GPT-3这种“万金油”式的生成式AI,那么我们就可以把它的认知领域缩小到更窄的范围,但同时深度大大加深。”
巨头来卷预训练模型,做基础生态,中间层和应用层的广阔空间则更加open,以上这几个企业也暗合了这个逻辑,切入点均有不同。衔远科技利用生成式AI能力将市场、消费者与趋势洞察直接生成为产品的创意与品参,致力于加速企业产品到市场的速度、提升爆款概率。聆心智能把重点放在了医疗领域,Tiamat则专注于AI 图像生成。
和垂直行业绑定,做深入而具体的工作,或许更容易跑出一条可行之路。
再看看这几家公司的掌门人,基本都是履历“金光闪闪”的大牛。
澜舟科技创始人周明,1991年就从NLP重镇哈工大拿到了博士学位,其后进入清华任职任教,并在1999年被微软亚洲研究院创始院长李开复挖走,后来不久成为NLP研究组负责人。直到2020年离开,周明已经是微软亚洲研究院副院长多年。
辞职后,孟子通用预训练模型开始孵化,于2021年4月正式推出。
2021年6月,10亿参数的孟子轻量化预训练模型在CLUE(中文语言理解测评基准)的任务比赛中获得第一。2022年8月,孟子预训练模型获得ZeroCLUE(Zero-Shot Learning,零样本学习)和FewCLUE(小样本学习)榜单第一。而后的一系列投资,也验证了技术硬实力加持下,澜舟科技足够的想象空间。
再数一数,衔远科技创始人周伯文曾是京东AI掌门人,他2016年提出的“自注意力融合多头机制的自然语言表征机理”,是Transformer架构的核心思想之一。竹间智能的简仁贤出身微软,曾是微软(亚洲)互联网工程院副院长,在职期间带领过微软小冰、小娜等聊天机器人项目。而聆心智能孵化自清华大学计算机系,履历皆是不俗。
反看前两年AIGC赛道拿到融资的企业,还集中在依靠接口或者开源模型的应用层公司,技术门槛不高,一级市场没那么容易买单。即使2022年下半年AI绘画火出了圈,也不过是一根燃烧几秒就难以为继的火柴。
而今年,ChatGPT则告诉我们,拾薪构火,想燃得大,得技术者得之,绑定深度场景者得之。
就像2015年阿尔法狗大火,有记者提问,百度什么时候能做出一个阿尔法狗这样性感的事情%3F
奇点已至,现在我们或许可以期待更多“性感”的企业跑出来。