对话贾扬清：明年AI推理成本还会降低10倍以上，一两年内AI使用成本或低于人工

作者：搜狐科技发布时间：2024-10-29

Lepton AI创始人兼CEO贾扬清

出品｜搜狐科技

作者｜郑松毅

编辑｜杨锦

近日，由声网联合主办的RTE2024第十届实时互联网大会在北京开幕。

大会开始前，Lepton AI创始人兼CEO贾扬清早早就坐在了嘉宾席。蓝色衬衫、牛仔裤，熟悉的那般“码农”形象再现。

他还是习惯性地把微笑挂在嘴边，和搜狐科技聊了聊最近美国硅谷发生的变化，以及对AI发展现状和未来趋势的一些看法。

这是他今年第二次回国，在大会开始前一晚刚到北京，但整个人看不出来丝毫倦意。

AI如何落地应用？国内外都在忙着找答案

“这次回来能明显感受到大家对于AI应用积极探索的热闹氛围，硅谷也正如此。”贾扬清说。

“相较于AI热潮初期的硅谷，现在的硅谷‘冷静’了许多，关注点更偏向于应用。大多数企业会选择在现有模型基础上加速功能迭代和研发。几乎没人还在比谁的模型更大、参数更多。”

他补充道，“同等质量的模型，规模会变得越来越小，计算效率会越来越高，模型架构会变得更加开放和标准，这是我观察到的未来趋势。”

如果说前两年的AI是在“卷”技术，那今年无疑都转向了“卷”应用。

在贾扬清看来，今天是做应用最好的年代，AI呈现出来的智能能力让做应用变得更简单，同时能够带给用户更好的交互体验。

以前人们常认为，芯片短缺是阻碍AI发展最大的“绊脚石”。但在贾扬清看来，“芯片供应链问题已经有了非常好的解决方案，因GPU短缺造成的算力问题不再会是瓶颈。关键是看如何找到AI应用路径，与垂直领域深度结合，真正把AI用起来。”

“就像当年‘电’刚被发明出来时，很多人不知道它有什么用，直到冰箱、电视、手机的出现，才让电的价值得以体现。”

但想让AI真正用起来，成本是一个不得不考虑的问题。

有人提出，“如今AI技术难广泛落地应用，问题是出在了高额成本上。从客服行业来看，标杆是5元每小时，这是菲律宾和印度的人工价格。要是AI使用成本比人还贵，就没必要了。”

对此，贾扬清比之前更加乐观。他认为，“成本不是核心问题，Token的推理成本可能在接下去的一年还会再降低十倍，甚至更多。公司更应该关注的是用户体验。让AI使用成本降低到人工成本以下，可能就是一两年的时间。”

他表示，“核心的大语言模型其实都差不多，但企业如何管理数据、怎么打通权限、用户搜索时是想找到文档还是想要内容总结？这些长远深度的思考远比模型本身更重要。”

GPU价格是个“伪命题”

除了应用，当前AI竞技场的另一关注点在于AI基础设施。

搞云计算出身的贾扬清，认为现在迎来了“云”的第三次浪潮，而AI正是这场革命的催化剂。

他介绍，“云”的前两次浪潮分别是2000年代的“Web云”，以及2010年代的“数据云”，而这次兴起的是“AI云”。

与前两朵“云”不同的是，“AI云”是在”传统云“的基础上增加了AI算法，利用神经网络等技术，可以满足更大规模的数据处理和计算需求。

“今天所有的AI应用都对大模型有非常高的需求，无论是AI图像生成还是AI视频生成，都会调用软件框架，最后落到云基础架构和GPU上面。”贾扬清说。

谁都不想错过“风口”的机会，“AI云”也正是贾扬清在辞任阿里巴巴技术副总裁后，看准的创业方向。

贾扬清说，“挤大模型赛道不是最想干的事，更看重AI发展背后生出的机会点，即对高性能计算的需求，以及AI市场会越来越需要好的云服务，这是团队最擅长的。”

Lepton AI和很多硅谷创业公司一样，团队规模并不大，大多是程序员和产品经理。

公司名字的由来也很有意思，在物理学中，“Lepton”指的是轻子，是一种基本粒子。

这和贾扬清所期望的一样，用最简单的方式和低廉的成本帮助其他公司解决行业痛点问题。

“他们需要更快的GPU、更好的供应链、更高的性价比、更加专业的服务...这一切都是我们正在做的事。”

具体来说，Lepton AI提供的是大模型推理引擎，建立了云平台供用户找到性价比最高的GPU资源。

贾扬清认为，“GPU价格在一定程度上是个‘伪命题’，因为Buy is better than build（购买AI云服务会比自建算力设施更划算）。”

他提到，“很多有前瞻性的CEO已经放弃纠结一块GPU到底需要多少钱，而是选择了这样的方式，把更多的精力和资源放在应用开发上。”

对话最后，搜狐科技请贾扬清谈了谈如何才能在技术创新的道路上找到自己的方向。

他想了片刻说，“创新没有捷径一说，兴趣是最好的驱动力，因为谁也猜不到未知技术领域会带来怎样的惊喜，能做的就是追随兴趣坚持走下去。”

相关资讯

大模型推理成本排行榜来了：贾扬清公司效率领跑

随着大语言模型技术的逐渐实用化，越来越多的科技公司提出了大模型 API 供开发者们使用。但前有 OpenAI「每天烧掉 70 万美元」，我们也有理由怀疑以大模型为基础的业务到底能不能持续。

大语言模型 OpenAI

机器之心 2024-01-26

ChatGPT成本降低10倍

席卷社交网络的ChatGPT，再扔出一重磅炸弹。近日，OpenAI公司在最新的博客文章中宣布，ChatGPT-API即将开放使用，而且费用比以前降低了10倍，现在每1000个token只需要0.002美元！商业公司调用其来实现内部对话和客服能力的成本显著降低，个人也可以几乎无负担地施展创意，让AI于工作学习发挥作用。“可以预见，以后客服不会...

ChatGPT OpenAI 客服

新行情Pro 2023-03-05

未来10年不套现！李开复谈AI：整个行业每年降低10倍推理成本，这是可以期待的【附中国生成式AI行业竞争趋势】

根据赛迪工业和信息化研究院公布的2024年中国人工智能多模态大模型企业综合竞争力10强排名情况来看，腾讯、科大讯飞、阿里巴巴分别排名在前三位，反映这三家企业的大模型产品在中国市场中占据优势地位。人工智能技术的…

生成式AI 人工智能腾讯科大讯飞

前瞻网 2024-05-22

为何大模型推理成本能翻10倍？深度解读百度文心4.0

ChatGPT的火爆全网也将“大模型”这一新鲜的名词带到了所有国人面前。什么是大模型？在计算机科学和人工智能领域，大模型通常指的是具有大量参数和复杂结构的模型。这些模型通常需要大量的计算资源和数据来进行训练，以便能够捕捉到数据中的丰富信息和模式。大模型在很多任务中表现出色，如智能对话、内容生成、内容设计、音视频制作等等。随着大模型的日渐普及，其功能和涉及的领域也在快速增加。日前，赛迪顾问《IT 2023》系列研究对外发布,研究显示大模型蕴含无限的潜力，创新应用场景十分广阔，为人类的生活和工作提供便利。大

百度 ChatGPT 人工智能

科技新赛道 2023-10-12

初创公司Groq推AI芯片500tokens/秒爆火，贾扬清：Groq成本或是英伟达H100的30倍

钛媒体App2月21日消息，一家名为Groq的初创公司在AI圈爆火。主要因其自研的LPU芯片在AI推理技术上，通过优化架构和减少内存瓶颈，实现了高效率和低延迟，在处理大模型时的速度远超英伟达GPU，每秒生成速度接近500tokens，而GPT-4仅40tokens。

AI芯片英伟达 GPT-4

钛媒体快报 2024-02-21

对话贾扬清：明年AI推理成本还会降低10倍以上，一两年内AI使用成本或低于人工

推荐体验

相关资讯

大模型推理成本排行榜来了：贾扬清公司效率领跑

ChatGPT成本降低10倍

未来10年不套现！李开复谈AI：整个行业每年降低10倍推理成本，这是可以期待的【附中国生成式AI行业竞争趋势】

为何大模型推理成本能翻10倍？深度解读百度文心4.0

初创公司Groq推AI芯片500tokens/秒爆火，贾扬清：Groq成本或是英伟达H100的30倍

近期资讯

当医疗遇上大模型，引领“AI+医疗”新变革

成都：“进万企、解难题、优环境、促发展”出实效

【前沿】三星心系天下W25/Flip发布大折叠变薄了

【系统】小米13无缘满血澎湃OS2？负责人称有些特效跟不上

熊猫推出新款27寸显示器：2K 100Hz首发499元

超便宜的新一代AMD APU不简单：内存配32GB LPDDR5X-8000

雷军谈小米15：因端侧大模型将取消8GB版本

全国汽车制造智能装备行业产教融合共同体启动

16款新品4人主讲！小米发布会时长敲定 | 骁龙8至尊版超频版曝明年见

科技专项成果HIV-1 DNA载量检测试剂盒在穗发布

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响