当前位置:首页|资讯|OpenAI|ChatGPT

周鸿祎:把大模型做小、供企业内部用,成本可从千万美金降至千万人民币

作者:搜狐智库发布时间:2023-08-26

原标题:周鸿祎:把大模型做小、供企业内部用,成本可从千万美金降至千万人民币

360集团创始人、董事长 周鸿祎

出品|搜狐智库

编辑|王晓旭

8月26日,在2023亚布力中国企业家论坛第十九届夏季高峰会上,360集团创始人、董事长周鸿祎发表演讲。

周鸿祎指出,如果企业真的用OpenAI的ChatGPT,会发现它有很多问题。所以,中国还有另外一条路,美国今天也在往这条路上发展,就是把大模型拉下神坛,换句话说,能不能把大模型做小。

周鸿祎说,“我觉得大模型更像电脑的发展,以后每个企业根据自己的应用场景,可能都有若干套大模型。”他非常反对一个观点,说大模型是操作系统,这样隐含的产业发展,全世界大模型只会最多三套,可能就两套,就被垄断了。

周鸿祎表示其中有几个关键点:

第一,把大模型做垂直、做专之后,它对企业更了解,它在公有大模型的基础之上再加入我们企业内部的很多知识的训练,

第二,现在大模型,包括国内还有开源的能力,对企业来说就够用了,现在企业就可以探索结合自己的场景。

第三,大模型做小了之后,大模型不一定在云端,可以在终端,可以在边缘。

周鸿祎表示,全世界现在也出现这个趋势,就是怎么把大模型做小,让它只解决垂直领域的问题,它的参数不一定要万亿、千亿,事实上今天很多开源的软件给的是百亿的模型,百亿跟ChatGPT不能比,但是在企业内部够用的时候,它就能把这个成本从原来的千万美金降到部署成本是千万人民币甚至百万人民币的级别。“这个目标就真正达到了,就把大模型拉下神坛,在座的诸位可能都有若干自己的大模型,这条方法在现阶段可能是在等待我们中国自己的算力突破之前,你可以认为是一个游击战。”他说。

周鸿祎说,“只需要少数的公司用大规模的投入把基础模型训练出来,提供给很多企业,企业用小规模的算力就能够进行微调,然后用小规模的算力进行部署,来进行推理和计算,在现阶段这样一算,可能目前的A100、A800再加上国产华为的910B,可以在一定阶段满足我们国家的需求。”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1