“家家都有大模型”,成为今年上半年科技圈最主要的秀肌肉方式。在短短几个月时间,已有近百家AI大模型涌现市场。通用大模型、行业大模型、垂直大模型,各企业纷纷选择最擅长的赛道起跑,大模型竞争就此变得激烈。
2023世界人工智能大会展示AI+智慧医疗服务成果。(图片由CNSPHOTO提供)
通用大模型竞争激烈
国内“百模大战”的第一枪由百度打响。
今年3月,百度生成式AI产品文心一言正式邀请测试。百度创始人、董事长兼首席执行官李彦宏表示:“文心一言和生成式AI,代表了一个新的技术范式,是一个每家企业都不可错过的巨大机会。AI市场即将迎来爆发式的需求增长,其商业价值的释放将是前所未有的、指数级的。”
作为国内首个公布的AI通用大模型,文心一言在“芯片—框架—模型—应用”四层架构进行了全栈布局。这也成为百度的竞争优势之一。
进入4月,阿里云“通义千问”大模型也开始邀请测试。阿里云智能集团CEO张勇表示,阿里巴巴的所有产品未来均将接入“通义千问”大模型,进行全面改造。
“面向AI时代,所有产品都值得用大模型重做一次,所有公司都在同一起跑线上。”张勇表示。
关于“通义千问”的定位,阿里云智能集团CTO周靖人表示,通义千问是一个通用的大模型,并不会根据某个具体的业务问题进行优化或定制。开放通义千问的能力,意味着企业不需要从头开始训练大模型,而是能够在通义千问的基础之上,结合应用场景、知识体系、行业特殊需求等,形成自己的专属模型。
在今年5月,科大讯飞发布了“讯飞星火认知大模型”。科大讯飞董事长刘庆峰表示,星火认知大模型已经在文本生成、知识问答、数学能力上赶超ChatGPT,争取10月底整体赶超ChatGPT。
今年6月,360集团发布了自主研发的认知型通用大模型“360智脑4.0”,并宣布360智脑已经接入了360旗下产品“全家桶”。
“中国已进入百模大战时期,除了基础能力外,更重要的是应用场景的比拼。”三六零集团(以下简称360)创始人周鸿祎表示。在C端,360计划将AI大模型能力嵌入核心产品中,使其像AI助手一样为用户提供服务。而在B端,360计划首先在行业大模型和大型企业领域进行应用。
除此之外,商汤科技发布了“日日新SenseNova”大模型体系,昆仑万维发布了千亿级大语言模型“天工”,北京智源人工智能研究院发布悟道3.0 大模型系列……
“国内AI大模型百花齐放,首先是因为大模型是新一代信息技术革命AI时代发展的基础,大型互联网公司都会跟进,创新型企业也会在有能力的情况下尽量去做。其次是因为国外相继开源了一些平台,可以节省大模型的训练成本,一些微调和推理的成本对于很多团队来说是可以承受的,因此国内大模型才得以蓬勃发展。”清华大学新闻与传播学院元宇宙文化实验室主任沈阳对中国商报记者表示。
“AI大模型百花齐放的现象表明了一个趋势,即生成式AI在未来可能会对产业结构以及社会带来深刻的影响。现在只是刚刚拉开帷幕,AI对产业的渗透正在加深。”百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示。
行业大模型另辟蹊径
在通用大模型竞争激烈的情况下,一些企业看到了行业大模型的落地优势,选择首先发布行业大模型。
今年6月,腾讯公布腾讯云行业大模型研发进展,并联合22家客户正式启动行业大模型共建合作,携手17家生态伙伴共同发起“腾讯云行业大模型生态计划”。
“我们认为,客户更需要有行业针对性的行业大模型。”腾讯集团高级执行副总裁、腾讯云与智慧产业事业群首席执行官汤道生表示。
汤道生认为,当前,通用大语言模型在应对产业场景落地时存在一定的局限性。首先,通用大模型的训练数据主要来自公开数据集或网络数据,对于特定行业的专业领域知识了解有限。此外,通用大语言模型的训练需要大量计算资源和漫长的训练周期,这对企业来说可能昂贵且耗时。同时,安全和合规也是必要考量因素。因此,选择与具备一站式行业大模型服务能力的云厂商合作,打造企业专属的行业大模型至关重要,在好用、易用的同时还能降低企业的成本和时间投入。
无独有偶,华为也选择发布行业大模型。
今年7月,华为常务董事、华为云CEO张平安在华为开发者大会2023上发布盘古大模型3.0。目前,盘古大模型已在金融、制造、医药研发、煤矿、铁路等诸多行业发挥作用。
“盘古为行业而生,就要为行业着想,更好地服务千行百业的客户。”张平安表示。
“华为在多个行业领域有非常强的商业基础,做行业大模型就能够快速运用到各个行业中,直接发挥经济效益和社会价值。而通用大模型面向C端用户,其生成结果不确定性较强,也会带来监管上的较大成本。”沈阳表示。
“通用大模型要真正做好并在C端市场上快速投入应用的话,其软件打磨是需要时间的,也会在内容管理方面面临大规模投入的成本难点和技术难点。所以,从研发进度来看,行业大模型可以优先使用起来,华为、腾讯在这方面有很好的基础,可以把它迅速投入到产业当中加以运用。”沈阳认为。
垂直大模型凸显优势
一些企业选择继续缩小AI大模型的适用范围,将其聚焦在了垂直领域。
今年7月,携程发布首个旅游行业垂直大模型“携程问道”,携程集团董事局主席梁建章表示,希望用户从包括“携程问道”在内的产品中获得旅游行业“可靠的内容,放心的推荐”。
携程推出垂直大模型的动机,正是看到了通用大模型的“不可靠”。
“垂直大模型的机会在于,AIGC遇到了非常大的挑战——答案并不那么可靠。”梁建章表示。他认为,即使规划节省了半个小时,但推荐的酒店或者行程结果可能有5%的几率是错的,那是得不偿失的。而“携程问道”作为垂直大模型,筛选200亿高质量非结构性旅游数据,结合携程现有精确的结构性实时数据以及携程历史训练的机器人和搜索算法,进行了自研垂直模型的训练。
知乎也基于自身的内容优势,推出了专属的大模型。
今年4月,知乎正式发布“知海图AI”中文大模型,知乎创始人、董事长兼CEO周源表示:“知乎以应用层和数据层的独特优势,将致力于为中文互联网的大语言模型添砖加瓦。”
“知海图AI”中文大模型首个大模型功能“热榜摘要”,旨在利用超强的语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户,给大家提供直观清晰的回答。
“携程和知乎等企业推出垂直类模型是非常有必要的,目前我们迫切需要垂直领域提供的行业大模型。垂直大模型通过通用基座大模型,再加上行业数据、行业微调和行业应用场景,可以在不断使用的过程中得到更多的社会反馈,从而达到较高的智能化程度。”沈阳认为。
“百模大战”竞争终局
蓬勃发展的AI大模型行业,很快便迎来了行业标准化和管理规范。
7月7日,在2023世界人工智能大会上,国家人工智能标准化总体组宣布了我国首个大模型标准化专题组组长单位名单。联合组长单位分别为北京百度网讯科技有限公司、阿里云智能集团、科大讯飞股份有限公司、三六零安全科技股份有限公司、华为云计算技术有限公司、中国移动通信有限公司研究院等6家企业。
“大模型标准化是很重要的。”吴甜告诉中国商报记者,“百度作为联合组长,在推动大模型核心技术研发、产业应用、生态建设方面,希望能够积极发挥自己的作用,推动大模型标准化的顶层设计以及规则研制。百度自身就是重要从业者,拥有第一手实践经验,希望能积极参与其中,推动和牵引大模型产业发展。”
7月15日,国家网信办联合国家发改委、教育部、科技部、工业和信息化部、公安部、广电总局公布了《生成式人工智能服务管理暂行办法》,旨在促进生成式人工智能健康发展和规范应用,维护国家安全和社会公共利益,保护公民、法人和其他组织的合法权益。
无论是通用、行业还是垂直,大模型数量在短短几个月内快速增长。在2023全球数字经济大会上,北京市经济和信息化局党组书记、局长姜广智表示,随着ChatGPT掀起大模型发展热潮,国内迄今已有80余个大模型公开发布。
如此多的大模型,其竞争终局不免令人好奇。
“从目前来看,不可能出现一家AI大模型一统天下的情况,因为AI大模型是否能够得到广泛使用,一方面要看技术能力,另一方面则要看应用场景和流量格局。”沈阳认为,“但是从终极方向来看,当到达通用人工智能的阶段时,我们或许只需要一个AI大模型。”
“AI大模型百花齐放只是一个阶段性现象。在演变的过程中,各家企业和机构会逐渐找到自己的定位,走向细分市场。”吴甜对记者表示,“我认为大模型的终局是,未来只有少量的几个大模型会留下来。因为从底层做起来的大模型成本非常高,需要多年积累、坚定信心和持续投入才能做好。未来我们可能只会依托于少量几个大模型,这些大模型将会有非常广泛的应用生态。”(记者 赵熠如)
来源:中国商报
物流技术与应用 2024-11-16