本报记者 李昆昆 李正豪 北京报道
近日,小米集团董事长兼首席执行官雷军发微博称,小米在AI领域已经耕耘多年,有AI实验室、小爱同学、自动驾驶等团队。“对于大模型,我们当然会全力以赴,坚决拥抱。我们正在研发一些有趣的技术和产品,等我们打磨好了,再给大家展示。”
小米方面在接受《中国经营报》记者采访时表示,小米在AI大模型方面并非从零起步。多年来,小米在保障用户隐私的情况下,累积了庞大的高质量数据支撑,而且前期已经有大模型方面的尝试和研发,会让小米在大模型方面的进展更迅速。
谈及小米为什么做AI大模型,盘古智库高级研究员江瀚分析,“我觉得小米做AI大模型更多是把自己的优势与体验提升起来,可以看到,小米这些年在AI和物联网领域有了很多布局,小爱同学的整体发展也还不错,所以在这样的情况之下,做AI大模型实际上是为了实现各个业务生态的联合,也符合小米万物互联的逻辑,所以我觉得小米做AI大模型是很正常的。”
小米探索AI大模型
据了解,早在今年2月9日的小米投资者会议上,该公司就曾透露其早就在AI大模型等方面有尝试,并且是多技术路线并行。接下来,小米将在这个方向加大人力、资源方面的投入。
3月24日,小米集团合伙人、总裁卢伟冰曾在财报电话会议上表示,小米在小爱同学上投入时间超过6年,在与用户交互体验中积累了长期可复用的经验。截至2022年12月,小爱同学全球活跃用户达1.15亿,有丰富的场景落地,可以支持手机、音箱、车等多种场景融合。未来,小米会继续进行大模型研究,引入更先进的大模型能力,包括探索多模态能力、智能座舱交互体验提升等。
小米方面向记者介绍称,4月14日,小米任命栾剑担任AI实验室大模型团队负责人,并向AI实验室主任王斌汇报。AI实验室大模型团队可以调度集团资源,包括不限于业务、研发、人力和投入等。这是小米在大模型方向的专项投入。
王斌是小米公司自然语言处理(NLP)首席科学家,原中科院研究员、博导,在NLP领域有超过25年的研发经历。栾剑是资深语言语音方向专家,曾任微软小冰语音首席科学家。加入小米后,他先后带领语音生成、NLP等团队,负责个性化语音生成、音乐生成、人机对话、机器翻译、文本生成等方向的研发,及在小爱同学等产品中的落地。
此前在财报发布后的电话会议中,卢伟冰谈到有关AI的话题时曾表示,小米采用多技术路线并行探索AI大模型的落地,ChatGPT的成功给了小米很大信心来验证这个方向的正确性。目前,小米的小爱同学即是典型的大模型落地场景。
卢伟冰介绍,小爱同学已经做了6年,在与用户的交互体验中积累了长期可复用的经验,同时,小米有丰富的场景落地经验,小爱同学支持手机、音箱、车等多场景的智能融合。未来小米将继续大模型研究,引入更加先进的大模型能力,包括探索多模态能力、智能座舱交互体验提升等。目前,小米AI团队超过1200人。
纷纷入局 抢占先机
目前,国内多家科技厂商相继推出生成式AI产品对标ChatGPT,但距离GPT-4还有一段距离。
3月中旬,百度最先发布文心一言,360的“360智脑”已经进行过现场演示,阿里、商汤也都已发布类ChatGPT产品。此外,有赞也带来了由大模型驱动的首个AI产品“加我智能”。就连飞书,近期也悄悄上线了关于智能助手“My AI”的Demo视频。
根据民生证券相关研报统计,目前国内已经有30多个大模型亮相,其中不乏参数规模超过ChatGPT规模的大模型。
各大厂商竞相落地大模型的原因很简单,因为大模型天然带有先发优势属性,率先发布的企业最容易形成“滚雪球”式的优势,一旦占领市场,相比于后来者会有无可比拟的优势。业内普遍认为,大模型未来会是寡头竞争模式。
江瀚认为,对于小米来说,它做AI最大的优势在于数据的积累和软硬件的结合,它可能不像那些互联网大厂一样拥有纯线上的优势,但是线上线下一体化联合的这种物联网优势,小米无疑很明显。小米就像一个杂货铺,它线上线下什么产品都有,自然而然有一个巨大的线上线下结合的核心优势,包括它的数据、软硬件的结合、语言模型的整体设置,以及其AI的具体场景化的优势,其他很多大厂并不具备。
最近,OpenAI联合创始人兼首席执行官Sam Altman接受媒体采访时表示,“大小并非衡量一个模型质量的正确方式,重要的是,将重点放在迅速提高(模型)能力上。”
“如果可以的话,参数数量应该随着时间的推移而减少,或者我们应该让多个模型一起工作。我们希望向世界提供的是最强大、最实用、最安全的模型。当然,我们并不是要忽略参数数量。” Sam Altman认为,未来模型参数应该向更小的方向发展,或者以多个小模型协作的方式工作。
此外,Sam Altman警告称,目前已经处在大模型时代的尾声,并表示如今的AIGC(人工智能生成内容)发展中,将数据模型进一步做大,塞进更多数据的方式,已经是目前人工智能发展中最后一项重大进展。他还称,诞生ChatGPT的研究策略已经结束。并且还声称目前还不清楚未来的发展方向将何去何从。
对于中国公司为什么在ChatGPT方面暂时落后的问题,清华大学人工智能国际治理研究院副院长梁正表示,在应用场景之下是底层架构和基础研究,当我们和业界去交流时,原以为他们市值已经这么高,在创新的基础上一定会大量投入,结果却不是,有的公司很少有做长期的规划,即便是定位于做基础研究的头部企业的研究院,对它的考核都是相对短期的。
民生证券相关研报指出,目前表面上大模型百花齐放,不再稀缺,是因为开源基础以及大公司本身的算力储备与资金实力,单纯发布一个大模型的门槛,没有市场想象的那么高。但是能够拥有高质量数据场景,才能持续迭代,性能逐步逼近ChatGPT的大模型,预计最终“杀出重围”的仍是“凤毛麟角”。市场会逐步凝结共识:得数据者得天下,数据成为大模型差异化竞争的关键。