编辑部 整理自 AIGC峰会
量子位 | 公众号 QbitAI
“中国有世界上最好最优秀的B端和C端市场,把做AI应用的门槛和成本降下来,就会激发出更大的产业应用空间。”
这是面对AIGC产业应用现状,商汤科技联合创始人、大装置事业群总裁杨帆的最新判断。
当前,Scaling Laws(尺度定律)仍在主导着AI的技术迭代,与此同时,也带来了大模型应用投入产出比不够好的问题。
而商汤的观察是,AI基础设施,正是破解这一难题的关键。
以上分享来自杨帆在中国AIGC产业峰会的现场演讲。为了完整体现杨帆的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。
中国AIGC产业峰会是由量子位主办的行业峰会,20位产业代表与会讨论。线下参会观众近千人,线上直播观众300万,获得了主流媒体的广泛关注与报道。
话题要点
以下为杨帆演讲全文。
尺度定律仍在主导AI技术的迭代
大家上午好,很荣幸今天在这里跟大家分享一下我们最近的工作和进展。
最近两年,人工智能伴随着生成式AI掀起了新的热潮,国内外对它的关注度都非常高。
过去一年跟很多业界的朋友聊,为什么国内市场增速没有那么快?其实背后的原因很简单,我们今天的能力还是有差距的。包括一些头部企业的机器模型能力,也是最近才逐渐接近GPT-4的水平。
但我们也有一个判断,自去年底以来,中国AI应用的普及程度正在不断提高,越来越多的新场景正在被发掘。我们预计,在今年下半年甚至明年上半年,中国的生成式AI市场将迎来爆发式增长。
之前跟很多朋友介绍过,2019年商汤在上海临港投建了一个计算中心。我们当时做这件事情的时候,大部分人持不理解甚至否定的态度:商汤作为算法和软件的轻资产研发企业,为什么投这么多资产做这样一个项目?
回过头来看,整个人工智能技术的发展方向和发展方式印证了当时的思考和判断。
△商汤上海临港AIDC
尽管有些业内人士认为人工智能需要更好的迭代方式,但今天的AI实在是太消耗能源了,从单位能源智能的角度来看,其性能仍然较弱。
至少到目前,我们看到,一方面,尺度定律还没有失效,只要把更多更好的数据灌进算法里,就能够形成更强大更通用的智能。这是目前整个行业内可以明确看到的清晰可行的路径,尺度定律仍在主导AI技术的迭代。
另一方面,我们也会注意到AI核心的关键性产业问题尚未得到解决,就是产业端的投入产出比不够理想。
今天,大模型研发的投资成本非常高,怎么让这些研发投入在市场端产生最大的回报和价值,是摆在大家面前共同的课题。
在当前AI生产甚至应用成本越来越高的背景下,降低门槛和降低成本就是必然的趋势,这也是AI基础设施出现的意义:
一方面,AI基础设施很好地契合了当前以尺度定律为主导的算法创新路径,为更大规模的AI三要素提供了基础化能力。
另一方面,只有把这些通用能力,不管是大规模算力集群还是模型API,甚至未来围绕超大规模数据的完整体系,把它做标准化、基础设施化、服务化,才有可能在未来让整个AI产业创新门槛更低、性价比更高,让更多人进来,在上面赚到钱。
我们始终觉得人工智能的基础设施,不仅仅是算力中心,而是三要素一体的基础设施化,这是激活人工智能产业生态的关键。
这里也向大家汇报一下商汤临港智算中心的最新进展。截至去年底,包括临港在内,我们已建成7-8个互联互通的算力节点,还有多个新节点在建设中。
这些节点的总算力超过12000P,其中临港单点算力接近10000P。这样的超大规模、智能化的先进AI算力,在当前仍是核心稀缺资源和关键能力。
另外我们看到未来芯片产业链将出现分化趋势。从2001年起,我们在芯片层面做了大量工作,与业内很多合作伙伴展开对接和适配。目前临港中超过15%的算力来自国产芯片,我们相信在未来产业发展过程中,这将创造更多价值。
AIGC应用爆发前提:降低门槛
除了基础的资源能力外,更重要的是如何帮助企业降低使用门槛,降低使用成本。这不仅仅是提供低成本机器和用低成本的电去提供租赁服务,尽管这也非常重要且必要。
在此基础上,我们希望通过对AI的理解、在AI软件方面的沉淀,以及不同层级的软件产品和服务体系,帮助大家更低门槛、高效率、低成本地进行人工智能大模型的研发和使用。
这件事我们做了很多年。去年底,沙利文在《中国AI开发平台市场报告》中,将商汤在这个领域的能力定义为全国领先。当然,我们看到业内今天仍在持续地发生快速的迭代和演变,我们希望在新时代浪潮之下,商汤紧跟节奏,持续地往前进步和迭代。
今天很多人做大模型应用的开发时,首先面临的问题是:在构建自己的模型,或基于开源模型迭代场景化模型时,如何快速地将模型部署为可用的推理服务,并在其后附加应用服务,同时降低推理服务的成本。
大家都知道今天市场上有非常多的模型应用,特别是去年,向终端用户收费还没有所付的资源费高,调用越多越赔钱,调用成本非常之高。
为了解决这一问题,我们提供了全套的解决方案,包括多层次的架构、工业化的调用。我们通过混合模型的调用方式,包括训练与推理的混合,降低了用户使用模型的成本。这是一个最简单的方法,也是目前业内大家都在尝试的:在为客户提供模型应用时,背后挂载的并非单一模型,而是多个模型。根据语言对话应用、用户问题的不同以及提示词设置的不同,模型引擎会在后面选择调用超大模型、中等模型或小模型,从而在优化用户侧服务体验的同时,极大地降低后台资源开销。
这种方式无疑会增加系统的复杂度。为了降低使用门槛并减少中间成本,我们采用了将所有这一切以标准化管线形式提供给模型和应用开发人员的策略。此外,我们还进行了大量的推理优化,包括单位算子和硬件匹配的优化,以使同样的计算任务获得更好的性能优势。
在我看来,未来中国AIGC应用大规模爆发的关键因素之一,是如何降低基础设施使用者的下游门槛和成本。
我们看到中国模型开发还是需要更加强大的生态,这方面落后蛮多的。从商汤的角度来说,我们推出了自己的生态计划,包括提供算力资源、开发者社区建设,以及基础的模型能力。我们相信这样的能力能够帮助业内更好地提升最终在终端的场景价值。
中国有世界上最好最优秀的B端和C端市场,当我们把做AI应用的门槛和成本降下来,就会激发出更大的产业应用空间。
除了提供基础设施,商汤自己也在开发大模型,拥有一套完整的日日新大模型体系。
商汤过去做计算机视觉业务比较多,更擅长相关算法,所以在语言类任务之外,现在更多关注于3D图像、视频、三维重建等领域,希望在其中贡献更多行业模型。在过去几个月,我们已经可以拿AI模型实现三维场景的制作。
大模型下一步发展的关键性挑战是世界知识。除了在电子设备里学习人类历史上的知识,大模型如何更好地感知现实世界、形成更深入的理解并提供有效反馈,也是今年大家重点关注的领域和方向。第一步还是对于现实世界信息的收集、理解以及重建。这方面我们做了很多探索,把这样的能力应用到传统线下文化、旅游、社交场景,能够提供很多价值。
我们可以看到,AI大模型能够推动的场景还是非常多的。从商汤的角度来讲,还是希望以自身的基础设施和平台化能力,支撑更加繁荣的场景生态。
我们通过过去十年AI产业探索获得的关键认知是:人工智能的未来发展和应用成功的决胜点,并不仅仅在于技术本身。当越来越多的企业和平台提供开源或闭源的模型服务时,AI应用的关键在于谁能在细分场景中提供更好的解决方案,谁能更准确地把握用户需求,谁能打造出更高的性价比。
从这个角度来看,我们这一代人的核心使命,或许就是要打造一个能够为开放生态赋能的基础设施和服务体系,以此降低AI应用开发的门槛,吸引更多创业者参与进来。
每个人在不同行业、不同场景、不同领域都有自己的专长和优势。他们中的许多人可能并不精通AI核心技术,也没有雄厚的资源投入到AI基础能力的研发中,但只有激活这些参与者,AI应用生态才能形成长期、持续、健康的发展。这也是商汤希望与在座同仁以及量子位这样的平台共同推动的目标。
以上就是我今天的分享,谢谢!
—完—
点这里👇关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~