前不久,原阿里首席AI科学家贾扬清的一条朋友圈截图四处流传。贾扬清说,他的一个朋友告诉他,某国产大模型不过是LLaMA架构,只是更换了几个变量名而已。
很快有好事者发现,在大模型、数据集开源社区Hugging Face上,就有一位开发者发出了类似质疑:“该模型使用了Meta LLaMA 的架构,只修改个tensor(张量)”。LLaMA是Facebook母公司meta旗下开源免费商用的开源大模型。
贾扬清的朋友圈之所以流传,很大程度是因为其戳破了AI圈一个人人皆知的秘密:所谓的自研大模型,其实“水分”很大。
一位投资人曾对「暗涌Waves」说:两个月就上线一个大模型,“想想就不对不是嘛”。早在今年五月的Waves大会上,中国人民大学高瓴人工智能学院卢志武教授就指出,所谓“国产大模型的春天”,不过是很多公司在“微调国外底座模型”的假象。
尽管从现实来看,微调似乎是不得而为之的。原因可以很宏观:openAI如此凶狠,除非你能超越它,否则做半天,很可能也不值钱,甚至不如开源。原因也可以很具体:这是一个没有两三亿美金几乎上不了牌桌的游戏,让一个初创公司从头训练大模型几乎是痴心妄想。
昨天的讨论中,青年AI学者符尧也在一个群中表达了自己的理解,他认为“如果因为架构不变而批评一个模型没有创新,这样的批评对任何一个模型都是不公正的”,因为所有的模型都是在前者的基础上接力完成的,“每个模型架构基本都大同小异,但效果完全不同”。
有投资人表示,在Hugging Face 上,架构一样但名字不同的模型的确很多,因为大部分改动的是训练方法以及数据配比。
贾扬清在后来的声明中也进一步解释道:他批评的并不是模型架构不改变,但是生生改了个名字。改名会带来的麻烦是,原来适配LLaMad的代码可以用,而现在则要做大量工作来适配新名字。
这起风波或许偶然,但也呈现出了在追赶OpenAI过程中,速度的紧张与边界的模糊。
对于中国的AI创业者——尤其是应用型创业者来说,作为新一代AI技术的追随者,他们正在进入的是一种前所未有的难以与OpenAI区分“你我”的模糊地带。
前几天召开的OpenAI开发者大会是一次最新的导火索。去年底,ChatGPT3.5横空出世后,中国的AI创业者有过几波集中的人头攒动。最早,无论是大厂还是创业公司,都有一种大模型执念。但GPT4的快速发布以及大厂进击后,除了Minimax和智谱AI,因为“起跑早,已经有相对成熟的大模型产品出来”,以及极少数其他公司,多数人快速放弃了大模型路线。
当时还存在、且大放光彩的王慧文创立的光年之外,以及王小川的百川智能,也很快选择了大模型和基于模型应用两条线并进。
但被称为“AI界春晚”的OpenAI开发者大会,预示了一大批初创公司的必然徒劳。这场大会不仅有会前流传的GPT-4 Turbo和更强大的全新功能,还将推出GPT store,以及自定义GPT(GPTs),而用户也可以创建自己的GPT。
这意味着,在中国创业者最擅长的应用这个赛道上,也极可能寸草不生:如果你没有快速掌握垂直的场景、数据,可能随时被吞噬。
这就是这一代AI追随者的窘境:新一代AI应用型产品定义,必然要结合大模型的能力边界,而关隘是,大模型的能力始终在快速演化,OpenAI始终在演化。
前端的变动不居,后段的应用就如同是沙滩上的高塔。
今年5月,某知名初代产品经理还信心十足地表示,Chatgpt3.5发布之后,中国的产品经理早已在行动。而这次OpenAI发布者大会之后,面对“AI创业者的机会还剩多少”的提问,他也只回复了一个哭笑不得的表情包。
过去在互联网和移动互联网时代的传递链条上,从copy to China到copy from China,中国的创始人凭借的是庞大的市场和用户群,孕育出的庞大产品经理,整个过程可谓是行云流水,异常丝滑。而在新的AI时代, 这种珠联璧合显然已经被打断。新一代的产品经理,不仅仅需要产品能力,还要充分理解大模型以及数据。
当然还有一条众所周知的变量在于:与技术与产品边界定义权一起失效的外部环境。
那么在当下,一个中国AI创业者、尤其是应用类公司,该怎样找到解法?
一个乐观者会告诉你,大模型一定分地域的,所以中国的大模型与OpenAI并不一定有直接竞争。
其次,那些基于AI的原生应用、社区以及掌握垂直场景、数据的公司,也会存在回旋的余地与大口呼吸的空隙。事实上,很多应用层创业者,也都来自教育、医疗、游戏等垂直领域。AI的进展也在进一步引燃自动驾驶、电动汽车、机器人等领域。
很多人提到“数据壁垒”之说:一种是垂直行业非公开数据积累,而ChatGPT主要是泛行业的公开数据;一种是用户私有数据的积累,“了解越多,就越懂你”。
这个逻辑大概率是成立的。因为在未来的垂直场景、数据的争夺战中,必然会迎来掌握崭新技术的AI创业者与手握数据和客户资源的传统企业服务公司、垂直领域龙头公司的一场厮杀。
让我们回到问题的最初。一位AI投资人曾向我们提出一个问题:“在OpenAI这个前所未有的新物种面前,谁又不是抄作业的那一个?”从模仿到创新,是大部分后发地区的必然路径,甚至这也是多数人生的路径。
其实更务实地说,问题应该是:怎样才是更有道德的“抄作业”?
在瞬息万变的创新生态里,往往都是迅猛且边界混乱的,过度“苛求规范”,某种意义的确会影响效率甚至扼杀创新。但即便如此,也应存在底线。
就像在最早那条朋友圈的最后,贾扬清发出的具体请求:各位大佬,如果你们就是开源的模型结构,求高抬贵手就叫原来的名字吧,免得我们还要做一堆工作就为了适配你们改名字……
保留原来的名字、或者多加个声明,就是这个时代里一份难得的体面。
WorkWin局域网监控软件 2024-12-19
轩展科技 2024-12-19
大忠电子 2024-12-19