在大模型核心技术研发上,360采取自主研发+合作研发“双引擎”驱动,提升核心“发动机”的竞争力。
作者/洛枳 南溟
出品/新摘商业评论
ChatGPT的成功绝不是凭一己之力,这款史上增长速度最快应用背后,合作者微软起着至关重要的作用,正是产研合作,才促成了大语言模型技术的颠覆性变革。中国已经掀起了大模型之争,然而几个月的喧嚣,却没有一家公司走上这条已经被验证的道路,中国版的“微软+OpenAI”是否会出现,是产业界关注的焦点。
今天,360公司和智谱AI的合作给出了答案,双方宣布达成战略合作。双方共同研发的千亿级大模型“360GLM”,并宣布该模型已具备新一代认知智能通用模型水准 。
一、中国的大模型时代正在来临
ChatGPT的发布引发了一场大变 革,微软宣布ChatGPT接入Office全家桶更是在应用上面带来了颠覆性创新,震惊了整个世界。
回看国内,在ChatGPT发布并应用后,各家大厂很快跟进,百度的文心一言,阿里的通义千问,科大讯飞的星火等都在大模型领域不断有新突破。
与此同时,各大厂也意识到,大模型技术的推进和具体应用结合的紧迫性。阿里云宣布阿里所有产品未来将接入“通义千问”大模型全面升级;科大讯飞的星火大模型具备文本生成、知识问答、数学能力等核心能力。
现实情况是,虽然很多公司都推出了大模型,但是各家大模型能力相差无几,没有一家能够遥遥领先、一统江湖,但可以肯定的是,当大家都在“画饼”时,落地才是关键。
业界有一个共识,最后能够胜出的决定性因素是“场景”,拥有场景的公司才能在未来的大模型产业竞争中占据领先地位。
大模型技术本身不再是一个门槛,产业和研究如何更好地结合,如何更好地落地,是所有入局大模型的玩家需要进一步思考的问题。
显然,沿着被验证过的路径走更容易获得成功。
360和智谱AI的合作,完全可以看做是中国版的“微软+OpenAI”。
如果只有产业公司,会缺乏Open AI科学家长期主义的理想,可能没有人想到在大模型编码人类所有的知识这条路上走得更远。
反过来也是同样的道理,如果只有Open AI,不断发论文是没有意义的,毕竟论文和技术如果不能跟用户的场景相结合,也是不能成功的。
微软和Open AI有非常好的分工:微软在自己的产品里绑上Open AI的服务,让Open AI的服务真正实现工程化、场景化、产品化,甚至包括商业化。
Open AI不一定擅长商业化,也不一定擅长产品和场景化,但就从核心技术上不断从GPT3.5到GPT4.0,说不准GPT5已经在路上。
国外已经蹚出了一条成功的产研结合的道路,360没有理由拒绝模仿这条成功的道路 。
二、技术+场景的“中国GPT组合”
智谱AI是由清华大学计算机系技术成果转化而来的公司,被评为国内“最具OpenAI气质和水准”的公司,去年11月,斯坦福大学大模型中心对全球30个主流大模型进行全方位评测,智谱 AI研发的双语千亿级超大规模预训练模型GLM-130B 是亚洲唯一入选的大模型。
专业测评结果显示,GLM-130B的准确性等关键指标与OpenAI、谷歌大脑、微软和英伟达等公司的大模型接近或持平,全球已有70个国家1000余家机构申请使用。
智谱AI作为领先的大模型技术企业,在追赶OpenAI方面处于头部位置。 然而单纯的技术过硬并不够, 更重要的成就表现在落实到现实场景的应用中去。
此次360和智谱AI的合作,正是大模型与场景结合的重要实践。360创始人周鸿祎一直强调场景在发展大模型中的重要性,他曾表示,技术如果不能跟用户的场景相结合,是不能成功的。
随着ChatGPT对人类的影响不断加深,国内越来越多的企业闯入大模型领域,对此,周鸿祎表示:最关键的已经不是你拥有大模型的技术,而是如何借鉴微软和OpenAI的合作模式,如何能够拿到更好的数据进行训练,如何实现更好的工程化的训练方法,以及,如何找到更好的用户场景,能够使用你的大模型。
据了解,360浏览器平均MAU为4.16亿,360搜索日均请求量超10亿次,这为大模型后续的流量运作、用户反馈、模型调优奠定了基础。
360比肩微软“全家桶”的全端应用恰恰为智谱AI提供了技术落地机会, 同时,通过全端应用的数据,又能帮助大模型技术提供数据支持,对于大模型来说,更多的数据支撑和场景信息反馈,也是辅助其改进的重要一步,技术与数据共同作用下产生飞轮效应。
一定程度上来说,大模型的“卷”,卷的不仅仅是技术,还有技术和应用的结合。
这一点,微软和OpenAI的产研合作模式,已经验证了其可行性。与此同时,国内大模型技术落地方面,还需要考虑更全面的应用,而不仅仅局限于某一领域,某一场景。
拥有能够和微软匹敌的用户场景,360和智谱AI的合作将成为中国版“微软+OpenAI”模式的最佳范本,在大模型产业竞争中占据一定优势,双方在技术上的的强强联合,在技术与场景的互补性上,能够将国内大模型产业竞争提升到全新的维 度。
三、AI时代,360的两条线
360的人工智能战略是“两翼齐飞”,一方面发展核心技术,另一方面抢占用户场景。
在大模型核心技术研发 上,360采取自主研发+合作研发“双引擎”驱动,提升核心“发动机”的竞争力。
360一直以安全闻名,实际在AI技术上,360一直是国内的第一梯队,有着长期的积累。早在2015年,360就成立了人工智能研究院,将CV、NLP等AI前沿技术应用于IOT、安全大数据等领域。同时,承接了安全大脑-国家级人工智能开放平 台项目。
得益于拥有国内先进的多模态研发团队,360在自然语言理解、机器视觉与运动、语音语义交互等方面达到行业领先,核心成员 和团队多次荣获AI相关比赛冠军/提名奖项。
大模型相关技术上,360通过多模态学习解决跨模态检索,提升了搜索效率,接着,利用迁移学习技术、快速落地文本分类、信息检索、人机对话、NER、Summary等能力进行了中文语言模型预训练研究。
之后,360着手图文跨模态研究,在50亿图文对中精选2300万高质量中文图文跨模态数据集开源。后续在CV、AIGC和MLLM上的研究,让360在大模型上的前期准备有了更坚实的基础。
在CV上,OVD开放了世界目标检测大模型Zero/Few Shot;在AIGC上,中文Stable Diffusion模型尝试解决了40亿图文对解决中文理解问题;在MLLM上,具备原生视觉和语言能力的多模态GPT通过领域对齐实现了跨模态知识迁移。
综合来看,360的自主研发经历了自然语言理解、机器视觉与运动、多模态大语言模型等过程,日益精进。
基于AI核心技术,360借助自身优势场景,“四路并发”落地大模型,分别面向消费者、中小微企业、行业、政企和城市提供大模型相关产品和服务。
360GPT的产品矩阵是360智脑,360智脑全景包括360CV大模型、360GPT大模型、3 60GLM大模型、360多模态大模型。
周鸿祎对自家大模型的落地有着清晰的规划,“360智脑”率先落地搜索场景之后,结合GPT能力的智能浏览器、AI生图工具和企业智能营销云将很快面向B端用户开放测试。显然在策略上,360并不急于求成,而是聚焦用户刚需,成熟一个场景,开放一个场景。
周鸿祎在多个场合强调,中国的大模型落后GPT两年左右,发展起来需要的是用户的支持、理解和宽容。在有些问题、有些技能方面,中国玩家有后来居上的可能。只是说在有些能力方面,像强推理能力、思维链、涌现的能力还需要一个过程。
诚然,中国的GPT发展得确实还不够成熟,但谁知道最后的胜出者会以什么方式出现呢,而这个玩家会不会是复制“微软+OpenAI”成功模式的360呢?我们拭目以待吧。