当前位置:首页|资讯|OpenAI|微软|苹果

对话周鸿祎:别被OpenAI带沟里去了

作者:亚布力中国企业家论坛发布时间:2024-09-25

周鸿祎360集团创始人(左)

近日,360集团创始人周鸿祎受邀参加“AI产品榜·1周年大会”,并分享了他对AI应用的最新思考。

以下为对话全文(有删节):

提问:我先请教一个问题,原来您和李彦宏有一个开源和闭源之争,现在依然还是坚持开源的观点么?

周鸿祎:你不要老是挑起矛盾啊,我对李彦宏是一贯拥护和支持的。最近我还亲身到武汉去体验了下萝卜快跑。百度在人工智能方面还是做出了很多卓越的贡献,包括国内的人工智能团队里,很多应该都是百度培养的人,百度相当于是自动驾驶的黄埔军校。

关于闭源和开源的争论一直都有,这很正常。最近,扎克伯格推出了 Lama3.1,从刷榜的成绩来说,接近了GPT-4, 有些地方甚至超过了GPT-4o,他还讲了为什么要做开源。从现在来看,开源肯定是一个正确的方向,没有开源的 Linux ,就没有互联网,今天开源给很多开发者提供了一种科技平权的可能。所以,这个问题不用争论。

有的公司继续做闭源,我觉得也是一种商业选择。有适当的争论也挺好的,不一定要堵着走同一条路,最后有条路走成功了就可以。

提问:最近你俩的观点好像也发生了一些变化,李彦宏也说不要卷模型了,要开始卷应用了?

周鸿祎:李彦宏在2024世界人工智能大会上讲的一个观点,让我觉得蛮诧异的。因为百度一直在做模型,然后李彦宏自己来说,大家不要再卷模型了。每次模型一出来,大家就开始秀各种花里胡哨的功能,我觉得没意义,应该卷产品、卷应用、卷场景。

这倒不是说验证了谁的想法就一定对。大模型经过2023 年的百模大战直到今天,只要不是太笨,其实大家都会回答这个问题。你不回答这个问题,你的投资人会问你,你的客户会问你:你做的东西这么好玩,但是怎么跟产品相结合?所以我有一个观点就是:大模型不是操作系统,大模型更像一个组件,更像一个电动机。

有人做出了世界上转得最快的电动机,最后这个电动机一定要跟用户实际的需求相结合。电动机只是代表了一种能力,还要跟用户的场景相结合。电动机买回去,装上传动轴、装上四个轮子,它可能就变成一台汽车;装上传送带,它就变成流水线;装上扇叶,它可能就变成电风扇。这取决于你怎么将它与你的业务相结合。

未来大模型会像电动机一样无处不在。今天小到一根电动牙刷、一个刮胡刀、一个吹风机,里面可能都有个电动机,但是你用这些产品的时候,根本感觉不到电动机的存在。同样,你买了台新能源车,在行驶的时候你也看不到电动机,但你能感受到它的能力。所以,我认为大模型应该消于无形,让我们都意识不到它的存在。面壁智能李大海讲的,我觉得也是这个理念,无论是云端云测模型还是端测模型,最后,它在里面默默地发挥作用。

提问:这是不是反映,大家在行业里也逐步形成了一些共识?

周鸿祎:今年,大家肯定要重新回到场景和产品上来。但是想在一年的时间里就解决产品场景的问题是不现实的,它大概需要个几年的时间,而且这已经相当快了。

1994、1995年互联网浏览器刚出来,1998年才有了谷歌,才有了2000年代的高速发展,大家也在探索中前行。所以,别太着急了,这确实需要一个探索的过程。

提问:在应用层面,老场景、老产品机会更多,好像 AI 现在也没有创造一个新的场景,创业者如何找到弯道超车的契机?

周鸿祎:我特别怕回答这种问题,你这个问题隐含了图省事的想法,就老想问我如何一招制敌。我要真的知道如何一招制敌,我就自己在家做了,我还跑到这来吹什么牛呢?

大模型技术跟我们过去很多产品模式的创新不一样,它是一个技术上的创新,是一个生产力提升的工具。

首先把已有的产品重塑一遍,把已有的业务流程重塑一遍,是大家比较容易想到的做法。好比蒸汽机刚出来的时候,大家首先想到的是,蒸汽机能不能取代磨坊把磨面给改善了,能不能带动纺织机提高纺织厂的效率。

所以你看,目前微软、苹果,包括各种智能硬件和AI的结合,都是用大模型把已有的能力重塑一遍,或者给已有的流程加上智能的能力,我觉得这个做法是比较务实的。而从蒸汽机到火车的构思需要时间,不光是要解决蒸汽机的问题,要解决驱动的问题,要解决火车铁轨的问题,要解决一系列的问题。

提问:在中国做AI,有什么机会?

周鸿祎:在中国,我个人觉得 To B 的市场,实际上是比较有机会的。这也符合国家的大政方针,有一次我开个内部的会,有一位大领导在会上内部就讲,你们做大模型,别老想着做娱乐的东西,要为国家的数转、制改做出贡献。国家现在强调的是产业数字化,要非常重视传统行业,特别是先进制造业,现代化工业的发展。

既然说大模型是一场工业革命,那它最好就应该直接提高劳动生产力,在 To B、To G 里面有很多场景。有人会说这个市场特别碎,好像感觉都是苦活、累活。

提问:本质像一个外包?

周鸿祎:我不这么认为。谁都梦想做一个互联网的产品像微信、抖音一样,一下子就几亿人用,然后就打造一个平台,但这种机会千载难逢,有时候撞上了也要有运气。

To B 的市场,正因为大家都在探索,所以这个市场比较碎。如果今天谁能拿出一个放之四海而皆准的方案,那一定没你什么事,你也没什么机会。正是因为比较碎,这里面才会有更多的机会。

提问:你说的场景到底是什么?

周鸿祎:这几天我也在思考:我们经常觉得我们的应用场景已经够细了,但事实真的如此么?我那天表扬了kimi,在所有的大模型都在卷通用 AI 的功能时,kimi 第一个提出要做文档分析、做长文档分析,随后大家都跟进了这个功能。但仔细想想,长文档分析,真的是一个垂直的场景吗?

提问:它不是一个高频行为。

周鸿祎:它还是太笼统,无论是从功能的角度看,还是从技术的角度出发,都需要再细分细化。

很多企业收到大量的合同,会对合同做一轮快速分析。企业雇不起自己的律师,或者花不了太多钱雇外部的律师,就可以用大模型帮看看这个合同有什么地方需要注意和警惕,提醒合同还有哪些不完善的地方。这实际上是文档分析的一个更细分的场景,在这个更细分的场景上,可能更容易去打动用户。

我觉得在 To B 领域,如果我们能够把场景进一步细分,跟企业直接的业务需求相结合,会有更多机会。刚开始的时候,用户也不清楚怎么做,你也不清楚怎么做,那为了做一两个POC(Proof of Concept 概念验证)当然要辛苦点。

今天大家都觉得华为很牛,华为做了很多产品,直接卖给大家,大家觉得了不起。可是你看华为在早期创业的时候,它也是给中国一些县市级的通信公司做交换机的机房,也是到现场去改软件,甚至到现场去改硬件,也是经过了这样一个必然的过程。一旦你在一两个模式上获得突破,找到了一个真实的场景,找到一两个成功的案例,你实际上就可以迅速地去复制。

提问:你怎么看待AI 在 To C 的应用?

周鸿祎:在 To C 的场景里,我觉得互联网这些巨头会在,自己已经稳固的场景里,比如,聊天是在微信,视频会在剪映上加上 AI 的能力。至于做创新的东西,我认为现在可能还真的还需要时间。

我发明了一个词叫NGFW:Not Good for Work。这种在国内就很难做。但是,我看那些国外的产品,包括中国团队在海外做的产品,如果能做得很深入,是很有机会的。目前,国外做这个 NGFW 的都是闷声发大财的状态。

提问:C.AI 创始人的退出或放弃,从模型角度来说不算成功,但从创业角度还算成。,你怎么看?有没有创业者可以参考的方向?

周鸿祎:出海做 NGFW。在国内,我就鼓励大家多为国家的大战略做贡献,多做 To B、To G 的应用。如果让我总结,我认为 C.AI 不叫成功。只是对于他的投资人来说,避免了一定的损失。

大家说他放弃了,说明还是做得不够尖锐、不够聚焦。他似乎创造了很多数字人,但是在每个数字深度都不够的情况下,你刚开始聊的时候很有兴趣,跟哈利波特聊一聊,跟孙悟空斗斗嘴,但这毕竟不是一种刚需和高频。

提问:但是 C.AI 从产品的使用时长上来说,确实是要比其他大部分的 AI 产品的时长要高非常多。

周鸿祎:跟更差的比可能好一点,但是它的付费率不足以支撑它的发展。

提问:你为什么要做专业的大模型?

周鸿祎:我在很多地方讲过,只要你场景选得足够窄,你对大模型的功能要求不那么全面,专业大模型就不需要那么高的参数,可能不需要千亿、万亿的参数,可能几十亿、百亿的参数就够了。前面面壁智能的PPT 里肯定是在讲这个,小块头也有大能力。而且基于开源的模型,做这种能力的蒸馏,实际上,对算力的要求也没有那么高。

最近,国内的正好这十几家大模型都不约而同地把价格降低了,这反映出两个原因:

一是他们确实也意识到,他们原来希望模型即产品这个想法,实际上没有那么容易做到。他们需要别人来使用他们的API,因为没有用户的使用和数据的反馈,这个模型是进步不了的。

当价格调低到一定程度的时候,你会发现短期内自己弄一个大模型的运营成本,可能甚至要高于用第三方大模型的 API。在这种情况下,那么你就会愿意接受去用它的API,这就形成一个良性的生态。价格的降低,也为我们很多开发者试错提供了一个机会。如果说大模型市场是一场工业革命,那一切才刚刚开始。

提问:从给成年人做一个聊天助手的角度看,为什么 OpenAI 这么强,大家却依然对很多场景不满意呢?

周鸿祎:因为成人的需求太多了,特别在工作场景里。在工作场景里有很多需求,目前大模型,如果不依赖很复杂的 Agent 框架,不依赖很复杂的 workflow,不调 API,光是一个 Co-pilot 模式,是不 work的。

但是,如果我们把它放在一个 3-12 岁的小朋友的场景里,比如,我手上戴的360儿童手表上,它是没有工作场景的,我也不希望手表变成一个学习机,就是小孩的一个玩伴,就是小孩的一个AI朋友。

那他所干的主要就三件事,一是陪小孩聊天;二是给小孩回答各种问题,回答“十万个为什么”;三是给小孩讲故事。实际上这几个场景,用大模型满足用户需求,绝对绰绰有余。同样的能力,你换一个场景就好解决得多。

提问:有人说,接 API 是套壳。你怎么看?

周鸿祎:不要去管别人说你是不是套壳,如果一用 API ,就被定义成套壳,那以后就没人不是套壳了,最关键的还是要找到应用场景。就像今天在新能源车里,汽车工业的分工特别明确,这也是汽车工业干了 100 年积累的一些传统。

比如,小米如果说什么都自己干、什么都自己造,那不可能三年就能造出一部好车。事实上,除了核心的智能座舱,核心的支架系统可能要自己做之外,其他很多的技术都是用第三方的供应商。那你说,这叫不叫套壳?

汽车的电池可能买的是宁德时代的,轮胎可能买的是米其林的。所以,我是觉得,可能大家这个这半年下来,有了很多的经验教训,这没有什么理由去嘲笑,也没有理由去放弃信心,放弃希望。

有两种套壳:

一种套壳是本身并没有加入新的场景,只是把自身的能力做了一个新的界面,这种套壳比较简单,也没有啥壁垒,你愿意去做也可以,国外有个公司叫 Poe。我们很多开发者被某些言论给害了,大家做创业的时候不能老听那些评论家的。因为评论家自己不做产品,点评别人很容易,有评论家妄自菲薄,就老认为用开源的就应该自己研发大模型,自己去买 H100 去搞算力,这就把很多开发者引入歧途。

另一种是把场景越找越准之后,你会发现,今天要解决垂直场景的工作,光有一个大模型和 API 是不够的。甚至说大模型都已经不是里面最重要的问题了,最重要的问题变成了:你构造什么样的 Agent 框架。

智能体会比大模型更重要。通过智能体,你才能让大模型从快思考变成慢思考,你才能让大模型从一个只知道喋喋不休的话唠,变成有手有脚、能够调API和真正干活的人。

讲一个可能与大家不一样的观点,Co-pilot 模式实际上不是一个好的场景模式,你真的去做过就会发现,它就是一个问答的专家,与用户的业务联系非常薄弱,而且并不能直接提高劳动生产率。

现在大家又开始关注 workflow 工作流,最近小到像 Comfy UI 这样的 workflow,大到像扣子和Dify,实际上都在往大的 workflow 在发展。一个大型的 workflow ,可以让大模型的能力真正与企业内部管理的业务流程、外部的产品和服务,紧密融在一起,包括 RAG 外部的知识对齐。

过去大家认为大模型才是核心,这些是大模型的辅助组件。现在如果大模型走垂直路线,RAG、Agent 和 workflow 变得非常重要,这几个东西做的好坏,直接决定大模型的效果。吴恩达也有一句话说,一个好的 Agent 框架和 workflow 加上 GPT3.5,最后在某些事上的效果可以超过GPT4.0。

总而言之,我们很多人也被 OpenAI 误导了,因为OpenAI 在发布 ChatGPT 的时候,为了让大家容易接受,做了一个聊天机器人的界面,我们很多人就迷信死了这个聊天机器人界面。实际上,在很多场景里,你做了一个聊天机器人界面,是不能直接解决用户很多问题的。

提问:我去了 ISC·AI 的发布会,你们发布了AI助手。AI 助手是一个什么逻辑?

周鸿祎:所谓AI助手,就是我们先把它集成到360浏览器和桌面上来,先让国内包括360智脑在内的16家兄弟大模型厂商,有一个入口的流量。同时,让愿意尝试使用 AI助手 聊天机器人的用户,有一个可以对比的对象。当一个大模型让你不确定的时候,让其他几个大模型的结果给你做参考,这样你总能找到正确的答案。

更重要的是,我们在做一个 COE 的架构,COE 架构类似 workflow 或 Agent 框架的一个扩大版,是我们专门训练的一个意图猜测模型。Agent 讲究模型的能力增强,Workflow 讲究模型与业务的融合,COE 架构讲多个模型的协作。通过意图猜测模型来知道用户的意图之后,来调度其他的若干个,这方面比较擅长的同行大模型来完成工作。

我们做了一个非常复杂的测试,大概有了4000个意图分类,是依据用户在使用 AI 搜索时候真实的问题意图来分类的,这要大过任何一张大模型曾经做过的卷子。我们给国内这 16 家大模型做了一个能力放射图,测试完我们就知道,百度擅长什么,阿里擅长什么,我们希望把它们的能力能综合起来,用户不需要手动地去调度用哪个模型,而是由我们的调度模型在背后调度。

相当于 16 个有点偏科的学生,每个人都只做自己最擅长的卷子,希望总分能够超过GPT-4。现在文字能力肯定已经能达到了效果,多模态还差一点。下一步,我们也会引入类似扣子、Dify 这样的 Agent 框架,那就不光是有一个意图猜测模型在做路由,在做任务的分工,而是通过 Agent 框架来调度多个模型。

譬如:你要做一个翻译,文心一言先做第一遍翻译,然后让阿里通义千问来做挑战和质疑,最后 DeepSeek 来做一个润色和改写。

可能三个模型通过一个workflow,通过一个 Agent 框架,协同工作就来达到某种效果。

提问:COE 框架已经用到360 的某些产品场景里了吗?

周鸿祎:已经用到了360安全大模型里。说得不对,因为没有一个叫 360安全大模型的东西存在,实际上,我们在里面做了 6 个专业小模型,这 6 个专业小模型,一个模型,就干一件事儿。

实际上,在360AI浏览器背后,我们最早也是一个千亿模型。我不知道 Kimi 的同学来了没有,Kimi 做长文本文档分析,我都替他们心疼,他们的费用肯定高得不得了。

因为大模型最难的就是成本高,所以后来我们把 1 个千亿大模型换成了 5 个百亿大模型,专门有个大模型做翻译,有个大模型做分析,有个大模型做阅读,有个大模型做改写。整个响应速度比原来千亿模型,可能快了十倍都不止,推理成本也降低了很多,对算力的要求也降低了很多。

所以还是那句话,一定要找对场景。找不对场景,你今天用 GPT-4 可能都觉得做不出来,交付不了。只要你不是老想着做出一个大模型,什么问题都能解决,那么找对场景,机会还是很多的。

可能大家都被 OpenAI 带到沟里去了,OpenAI 的想法是做出全宇宙最强的 AGI,全世界无论什么人、不管干什么,都来用我这一个东西就好了。这个想法固然伟大,但是现在,它真的还实现不了。

责编|许加林

排版|王紫薇

商务合作联系15010075732

青春合伙人招募关注公号“青春合伙人”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1