当前位置:首页|资讯|商汤|AIGC|ChatGPT|大语言模型

商汤杨帆:大模型并非单纯暴力美学,背后是大量软件工程系统问题 | 中国AIGC产业峰会

作者:量子位发布时间:2023-05-14

原标题:商汤杨帆:大模型并非单纯暴力美学,背后是大量软件工程系统问题 | 中国AIGC产业峰会

杨净 发自 凹非寺

量子位 | 公众号 QbitAI

大模型引领的AI 2.0时代,远比想象来得更加猛烈——

它以对话即入口的方式,即将改变着我们生产生活。

那么对于上一波技术浪潮涌现的AI1.0公司,到底有何影响?

在首届中国AIGC产业峰会上,商汤科技联合创始人、大装置事业群总裁 杨帆在现场给出了最新思考。

他认为,我们在关注ChatGPT以及大语言模型的同时,一定不能忽视近几年整个人工智能技术进展是 全方位的。

除此之外,他还谈到了这一波技术革命的另外两大特点:1、会更快地形成产业应用;2、背后是持续的投入、经验积累,并非单纯暴力美学驱动。

事实上,ChatGPT的出现,给下游诸多应用打开了新的出口,但“如何高效率、低成本、规模化落地?”就成为了亟待解决的难题。

商汤大装置作为行业代表性解决方案,它类似于AI版“发电厂”,打通了算力、算法和平台,能做到批量化生产各种AI算法模型,并进一步部署、迭代和升级,也就进一步帮助AI产业落地。

未来,杨帆也做了进一步畅想:正如任何一个成熟产业链一样,人工智能产业将在未来几年,变成多分工、多分化的,并形成一种开放的生态。

中国AIGC产业峰会是由量子位主办的行业峰会,近20位产业代表与会讨论。线下参与观众600+,线上收看观众近 300万,得到了包括CCTV2、BTV等在内的数十家媒体的广泛报道关注。

演讲要点

  • 这场人工智能技术进展主要有三个特征:1、全方位的;2、更快地形成产业应用;3、背后是持续积累,并非单纯暴力美学驱动。
  • 接下来几年时间一定会迎来整个人工智能更繁荣、开放的生态。
  • 今天大模型研究背后实际是大量软件工程系统问题。
  • 当下一些核心应用,天然有大量的C端因素,以及在很多使用场景中能天然打造起数据闭环。这既更符合AI技术高速迭代本身,也将带来很强的飞轮效应。
  • 最近两年大量技术突破都来自于「暴力」,但并非单纯资源积累,而是牵涉到每个环节很强的经验积累。

以下为杨帆演讲全文:

AI核心技术突破和进展是全方位的

今天站在一个新时代的开端,有人叫AI2.0,有人叫大模型时代,当整个技术能力、商业化迭代非常快的时候,我觉得可能更需要一种不同的能力去帮助整个产业。

首先分享一下个人观点,ChatGPT展现的AI技术能力,其实是个非常大的破圈,但在我个人看来,最新一些AI技术进展远不止如此。

正如七八年前AlphaGo导致大众对AI有很强的感知和冲击,但在那之前,2012年所带来的变革更加深远。

这里想说的就是前两年的AI for Science,我甚至觉得它对整个人类技术进步、或者对我们整个科技产业贡献、未来产业经济格局的改变,可能会更大。

今天AI已经能帮我们解决什么?它能模拟人类蛋白质结构,很多人拿它去做材料合成、新材料的推演;它还可以做大量数学物理,去做过去没办法做到的计算和推理,甚至它在尝试去做核聚变的一些推演。

ChatGPT是每个人都能感知到的,在消费级会给大家带来巨大冲击。但刚才讲的这些可能是决定整个人类底层的科技进步,对整个社会经济产生重大改变。

我当然不是说ChatGPT不牛,但我想说的是,我们在关注ChatGPT以及大语言模型的时候,一定不能忽视 整个人工智能近几年核心技术突破和进展是全方位的

与此同时,这样的技术进展还有个很强的特征,比起过去, 它能更快地形成产业化应用

比如AI绘画,很多人已经在做商业化了。而起初被诟病的「手指」问题,现在也已经解决了,技术迭代和应用都非常快。

这是这波技术浪潮第二个非常值得关注的点,就是技术突破与商业模式探索之间的窗口期更短了,带来的是极强的加速效应。

第三个点想说的是,这一切产生的背后,我们能够看到什么?

不管是超大规模计算资源的聚集、超大规模模型结构的设计、还是海量数据汇聚……最近两年大量技术突破都来自于这种暴力美学。这种暴力也并非单纯资源积累,而是牵涉到算力、算法、数据每个环节很强的经验积累。

诚如OpenAI的GPT-3.5到GPT-4,很强的一点就是在数据量上的跃升。在业内交流中发现,OpenAI将整个公司最优秀的算法研究员拿去做数据规划和处理,这可能是之所以做出这么好模型的重要环节。

今天大模型研究背后实际是大量软件工程系统的问题。

OpenAI能用一万块V100训一个模型,据我了解,国内还没有团队能在一万块卡上保持高的加速比且做稳定。这些都是大的挑战,一方面是大力出奇迹,另一方面里面核心know-how需要持续沉淀和积累。

给AI产业带来什么变化?

首先是 生产范式的重大改变。为什么有人把这波叫AI2.0,你会发现一个新的AI技术去做产品、完成商业模式、创造客户价值等,整个事情逻辑都在发生很大的变化。

2018年商汤就有一些预感,因为当时感受到去服务产业客户太痛苦了,你会发现行业里所有事情几乎都得你自己去做,上下游合作伙伴能帮忙的地方非常少。因为AI本身是个高门槛、高成本的东西,但你看任何一个成熟产业链一定是多分工、开放以及大家各司其职的。

当时就会想一个问题,到底什么时候人工智能产业会走到这种状态?多分工、多分化、开放的产业生态。

今天我们看到了一个似乎很切合的答案。

这种关键性AI基础设施包括算力、模型服务(MaaS)都让整个产业门槛极大下降。同时因为提供这种基础设施的厂商一定是少量的,也将面临巨大的下游生态,所以它的规模化会带来非常高的边际成本的下降。

这对人工智能赋能产业带来极大的改变,未来可能会产生更大价值,今天很多创业者、投资者都希望在这里寻找到属于自己的机会。

在我们看来,这个机会其实是非常广阔的,它打破了过去人工智能在产业落地因为技术产生的高门槛。

另外,今天一些核心应用,天然有大量的C端因素,以及在很多使用场景中能天然打造起数据闭环,这既更符合AI技术迭代本身,也将因为高速迭代可能带来很强的 飞轮效应,产品具备长期持续性,商业壁垒门槛更容易建立。

所以一个感受是, 接下来几年时间一定会迎来整个人工智能更繁荣、开放的生态。

在这之前有记者问我,AI2.0对AI1.0公司是不是有很大影响?我说这个不是很准确。

商汤早在2018年就相关探索,当时叫做预训练模型,直至现在商汤通用视觉大模型也始终是世界参数量最大,在过去支撑了整个集团业务的持续发展。

商汤平台内容 “一平台四支柱”中的“一平台”,指的就是人工智能基础设施“大装置”。多年的持续投入,源于商汤坚持认为AI基础设施未来会支撑更加百花齐放的产业生态。而从基础设施层面讲开去,大量模型设计和系统调优经验能够支撑大模型服务,帮助更多人迭代自有模型。

总体而言,这件事的核心价值在于,整个AI基础设施会具备弹性和拓展性。通过提供全方位能力,商汤希望为整个人工智能基础设施、市场及产业,提供更加基础化的支撑能力。

我们也相信,在下一个时代,当我们技术整个具备了更大的关键性能力前提之下,通过更加大规模、高效率、低成本的AI基础设施,实现更好的服务,支撑到未来百花齐放的产业生态。

最后一句广告语,希望大家训AI大模型,找商汤大装置,谢谢大家。

「人工智能」、「智能汽车」微信社群邀你加入!

欢迎关注人工智能、智能汽车的小伙伴们加入交流群,与AI从业者交流、切磋,不错过最新行业发展&技术进展。

PS. 加好友请务必备注您的姓名-公司-职位噢 ~

点这里 👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1