对话旷视科技唐文斌：应用落地是衡量大模型价值的最高标准

作者：中新经纬发布时间：2023-07-08

中新经纬7月8日电 (常涛)由ChatGPT引发的大模型热潮还在持续，在6日开幕的2023世界人工智能大会(下称大会)上，大模型站上“C位”。对于大模型的未来发展图景，用户亦充满想象。

大会期间，旷视科技联合创始人、CTO唐文斌在接受中新经纬采访时说，应用落地是衡量大模型价值的唯一标准，旷视科技也会从视觉大模型向通用多模态大模型进军。

大模型未来要靠“两条腿”走路

唐文斌表示，多模态大模型是通向AGI(通用人工智能)的必由之路。大模型是当前AI最重要的技术发展方向，它让AI技术走上融合统一之路。以视觉、语言、机械控制等为核心的多模态大模型，是AI系统走向智能化、通用化的必经之路。旷视科技会积极拥抱多模态大模型，从视觉大模型向通用多模态大模型进军。

当前，“百模”大战喧嚣过后，行业对于大模型的狂热正在回归理性区间。大会期间，越来越多的企业也意识到，无法落地的大模型没有实际价值，只有成为行业应用的大模型才有产业价值。

唐文斌认为：“应用落地是衡量大模型价值的最高标准。大模型未来的发展，一定要靠‘技术’和‘行业’两条腿走路。”

对于旷视科技来说，唐文斌介绍，公司会专注在“大模型+机器人”方向，将大模型与硬件载体结合。围绕这个方向，旷视科技一直坚定投入大模型研发，且具备了大模型原创科研能力。

“历经多年的积累，旷视科技已经构建起涵盖算法、系统和硬件的全栈式技术实力。这样‘三位一体’的技术能力体系，让我们拥有独特的身位优势，去迎接大模型时代。同时我们也面临很多挑战，作为一家AI创业公司，旷视科技不具备那么奢侈的生存和成长条件。因此，我们必须坚持‘技术创新’和‘商业落地’两条腿走路。”唐文斌说。

大模型是人工智能确定的方向

唐文斌表示，大模型方向是业内共识，更是人工智能确定的发展方向。过去几个月，基于生成式AI的大模型引发很大关注，特别是以ChatGPT、GPT-4为代表的AIGC产品引领了新一轮AI发展浪潮。

聚焦旷视科技的业务，唐文斌介绍，旷视科技提供的AI技术、产品与服务，一直是围绕AI的应用场景来展开的。十年前计算机视觉算是最前沿的技术应用场景，而如今新的ChatGPT，又将生成式AI应用到各行各业中。虽然每个时代有每个时代的科技热点，但底层逻辑却亘古不变。

唐文斌表示，如果将AI的应用场景进行分类，旷视科技认为一种是“AI in Digital(数字世界的人工智能)”，另一种是“AI in Physical(物理世界的人工智能)”。前者的典型应用是抖音，从推荐到多模态的AI算法应用，多在互联网领域。而后者的典型应用是特斯拉，将AI算法与物理世界的硬件相结合，从而让科技为人类所用。

唐文斌表示，旷视科技坚定看好“大模型+机器人”的方向，这也是旷视科技未来最大的机会。随着技术和应用的推广，大模型一定会和行业、物理世界结合。