中新经纬7月8日电 (常涛)由ChatGPT引发的大模型热潮还在持续,在6日开幕的2023世界人工智能大会(下称大会)上,大模型站上“C位”。对于大模型的未来发展图景,用户亦充满想象。
大会期间,旷视科技联合创始人、CTO唐文斌在接受中新经纬采访时说,应用落地是衡量大模型价值的唯一标准,旷视科技也会从视觉大模型向通用多模态大模型进军。
大模型未来要靠“两条腿”走路
唐文斌表示,多模态大模型是通向AGI(通用人工智能)的必由之路。大模型是当前AI最重要的技术发展方向,它让AI技术走上融合统一之路。以视觉、语言、机械控制等为核心的多模态大模型,是AI系统走向智能化、通用化的必经之路。旷视科技会积极拥抱多模态大模型,从视觉大模型向通用多模态大模型进军。
当前,“百模”大战喧嚣过后,行业对于大模型的狂热正在回归理性区间。大会期间,越来越多的企业也意识到,无法落地的大模型没有实际价值,只有成为行业应用的大模型才有产业价值。
唐文斌认为:“应用落地是衡量大模型价值的最高标准。大模型未来的发展,一定要靠‘技术’和‘行业’两条腿走路。”
对于旷视科技来说,唐文斌介绍,公司会专注在“大模型+机器人”方向,将大模型与硬件载体结合。围绕这个方向,旷视科技一直坚定投入大模型研发,且具备了大模型原创科研能力。
“历经多年的积累,旷视科技已经构建起涵盖算法、系统和硬件的全栈式技术实力。这样‘三位一体’的技术能力体系,让我们拥有独特的身位优势,去迎接大模型时代。同时我们也面临很多挑战,作为一家AI创业公司,旷视科技不具备那么奢侈的生存和成长条件。因此,我们必须坚持‘技术创新’和‘商业落地’两条腿走路。”唐文斌说。
大模型是人工智能确定的方向
唐文斌表示,大模型方向是业内共识,更是人工智能确定的发展方向。过去几个月,基于生成式AI的大模型引发很大关注,特别是以ChatGPT、GPT-4为代表的AIGC产品引领了新一轮AI发展浪潮。
聚焦旷视科技的业务,唐文斌介绍,旷视科技提供的AI技术、产品与服务,一直是围绕AI的应用场景来展开的。十年前计算机视觉算是最前沿的技术应用场景,而如今新的ChatGPT,又将生成式AI应用到各行各业中。虽然每个时代有每个时代的科技热点,但底层逻辑却亘古不变。
唐文斌表示,如果将AI的应用场景进行分类,旷视科技认为一种是“AI in Digital(数字世界的人工智能)”,另一种是“AI in Physical(物理世界的人工智能)”。前者的典型应用是抖音,从推荐到多模态的AI算法应用,多在互联网领域。而后者的典型应用是特斯拉,将AI算法与物理世界的硬件相结合,从而让科技为人类所用。
唐文斌表示,旷视科技坚定看好“大模型+机器人”的方向,这也是旷视科技未来最大的机会。随着技术和应用的推广,大模型一定会和行业、物理世界结合。