当前位置:首页|资讯|AI大模型|人工智能|OpenAI|国内AI大模型

国产AI大模型“卷”成“百模大战”,又多又乱的行业破局点是啥?

作者:神经童非童发布时间:2023-12-21

毫无疑问,大模型已经成为2023年科技领域的热门话题。随着大模型的出现,AI人工智能再次迎来了一个充满机遇和活力的时代。在OpenAI的开发者日活动之后,GPTs模式进一步引发了新一轮的AI热潮。《OpenAI首次举办开发者大会,国内AI大模型创业公司和BAT大厂恐怕都要重新定战略了……》。中国的IT从业者、软件开发者与AI工程师也积极参与讨论,共同见证了这场新的AI狂欢。

在这种繁荣的氛围下,绝大多数大模型公司为了模仿类GPT的大模型,中国AI圈用了一年时间,迅速打造了上百个大模型。AI大模型是推动各行业创新发展的重要力量,其对社会产生的影响前所未有,数字经济应用实践专家骆仁童博士表示,AI大模型为企业引领智能化转型开创了新的方向,通用AI大模型具备处理多种任务的能力,代表了科技发展的最高水平,也成为了顶级互联网企业竞争的焦点领域。

但值得注意的是,目前在众多大模型中能够诞生明星应用,推动产品创新,甚至拥有规模化用户的似乎寥寥无几。据不完全统计,上半年国内共发布了64个大模型,但到12月,叫得出名字的国产大模型已接近200家。甚至已不止一款国产大模型“碾压”了GPT-4,且很多“世界顶级”大模型是出自刚成立的团队之手。

而且,国产大模型在国外的境遇却是冰火两重天。开源AI社区代表Hugging Face发布最受欢迎开源大模型机构TOP15榜单,在大名鼎鼎的Stability AI、Meta AI、Runway、OpenAI、谷歌、微软等海外机构外,只有一家机构来自中国:KEG实验室(全称为清华大学知识工程实验室,成立于1996年),其凭借今年开源的模型ChatGLM-6B上榜。

那么,为什么会出现这么多大模型呢?一方面,今年大模型机会难得,即使科技板块的VC市场低迷的情况下,其他互联网创投项目更悲观,相比区块链、元宇宙题材,AI大模型成为今年近乎唯一的故事。

另一方面,大模型创业并没有真正意义上的高门槛。一旦以股权、期权等方式吸引到了合适的人才,大模型创业公司过多的费用支出。相比于其他科技领域有产品研发、用户推广、硬件化等烧钱选项,在拥有大量开放数据集、免费工具的情况下,仅仅是训练大模型并没有过高的成本门槛,往往一个科研团队就可以支撑。

百度文心一言、阿里通义千问、和科大讯飞的星火认知大模型等都是当前国内在人工智能领域具有代表性的大模型,从总体来看,国产大模型有如下共同之处:

第一具有开放性。这些模型通常都是由各自公司的云平台提供服务开放给开发者和企业使用。通过API接口、SDK工具包或特定的开发平台开发者能够拥有使用模型的能力进行应用的开发和部署。

  • 华为盘古大模型定位于“为行业而生”,与合作伙伴共建行业大模型,应用于多个场景。华为云盘古大模型3.0分为L0基础大模型、L1行业大模型、L2场景模型三层架构。

  • 百度文心一言注重发展大模型应用生态,发布AI原生应用商店和大模型全链路生态支持体系,赋能伙伴商业增长,共建繁荣的大模型产业生态。

  • 阿里通义千问通过打造“模型超市”降低大模型使用门槛,让更多企业和开发者便捷获取和使用大模型。

  • 科大讯飞星火和腾讯混元大模型通过开放平台和工具,提供技术支持和培训,吸引开发者参与大模型应用开发。

第二模型规模大。这些模型都是大规模的AI模型具有非常多的参数在多种语言和任务方面表现出色。它们的训练数据覆盖了广泛的领域和应用场景能够提供较为全面和准确的信息处理。

  • 除阿里通义千问外,华为盘古大模型、百度文心一言大模型、腾讯混元大模型和科大讯飞的星火认知大模型尚未开源。阿里云在2023年8月3日宣布开源通义千问70亿参数模型,包括通用模型Qwen—7B和对话模型Qwen—7B—Chat。这两款模型已在魔搭社区上线,开源、免费、可商用。阿里巴巴通过旗下开源平台提供API接口和技术支持,积极参与开源社区贡献和技术交流。

  • 百度文心一言的文生图能力来自开源模型ERNIE-ViLG。百度表示,在大模型训练中使用全球互联网公开数据,符合行业惯例。因此,尽管文心一言本身不是开源项目,但其部分功能建立在开源模型基础上,可能以开源形式对外提供。

  • 华为云盘古大模型全栈技术由华为自主创新,未采用任何开源技术。由于盘古大模型定位于赋能千行百业,聚集行业大数据,未来不会开源。但通过华为云平台提供API接口,便于开发者和企业二次开发和应用。

第三技术架构先进。这些模型通常基于深度学习技术和算法进行训练具有强大的多语言翻译、理解、推理和生成能力它们不断地进行迭代和优化以提供更好的性能和服务。

第四应用场景广泛。这些模型在多轮对话、逻辑推理、文本生成、情感搜索、小度智能音箱等场景中表现较好;腾讯混元大模型在微信、QQ、游戏等场景中更有优势;华为盘古大模型则在华为云、手机等场景中有着良好的应用。

但数字经济应用实践专家骆仁童博士认为,当前庞大的大模型规模不可能持续存在,除了原本头部科技公司的大模型具有持续投入的能力,其他的大模型都不可能持续。

众所周知AI由算法、数据、算力三要素构成。相比于传统的识别型AI小模型、以GPT为代表大模型在数据、模型等方面均带来了不同程度的革新让了大模型具有更强的通用性。但目前国产大模型存在如下问题:

第一,大模型的数量多,其实和大模型本质背道而驰。数量过剩的大模型,这与大模型初衷南辕北辙,并且浪费了海量的社会资源。

第二,大模型是底层技术,底层技术的投入极大。模型之上还有AI芯片、AI框架,这是一个注定洗牌到存量很少的赛道。

第三,大模型距离开发者很远。绝大多数初创大模型都会选择开源吸引开发者的模式。但现实情况是,这些模型没有实际竞争力,无法形成规模化的开发者聚合效应。这些大模型普遍是开源时大力宣传,但开发者实际体验后马上遇冷。

第四,大模型距离用户很远。对于大型模型创业企业而言,最初的阶段是最困难的。相比之下,备受诟病的机器视觉公司在初创阶段还可以依靠智能安防市场作为支撑,但大型模型企业只拥有算法,甚至找不到一条可行的商业化路径。

第五,大模型行业在涉及PK技术参数方面,大模型榜单存在一些问题。目前“跑分乱象”日益严重,在令人眼花缭乱的大模型榜单上,似乎每一个模型都曾获得过第一名,并随时可以超越GPT-4,导致鱼龙混杂。

这些问题导致堆积了巨大数量的大模型赛道开始变得混乱。中国的大模型发展迅速,远远超过了实际需求。数量过多的大模型不仅浪费了大量的研发资源、计算能力和数据资源,同样也存在着潜在的危机。

当资本泡沫冷却之后,很容易出现大量大模型停止更新、公司倒闭等情况。随着资本撤离,员工待遇下降、公司倒闭等问题出现,然而,这并不代表AI技术不好,而是指这些AI公司和大模型项目本身存在问题。

通过产业优化重组,大模型产业形态能够最大限度地发挥中国在应用创新、产品打磨和产业智能化落地等领域的优势。中国的大模型产业形态在未来应该是由大约5家可以相互竞争的主流大模型企业组成,其中1到2家能够进行底层技术创新,保持全球竞争力。另外还应该有一系列开源大模型作为补充,并有一些学术领域的大模型来支持科学研究。

此外,还需要完善的大模型配套设施,包括AI芯片、AI计算、深度学习开发框架和AI开发工具,并且这些领域都需要具备较高的自主化程度。换言之,必须淘汰超过90%的大模型,以实现更加健康良性的发展。

随着各大公司纷纷入局大模型赛道,微软GPT-3/GPT-4、华为盘古大模型、百度文心一言、阿里通义千问、腾讯混元大模型和科大讯飞的星火认知大模型等都在各自的领域进一步提升实力,基于通用大模型的行业应用将成为关键。

从参数上看,微软没有直接开发GPT-3/GPT-4,而是与OpenAI合作,将GPT-3/GPT-4集成到其产品和服务中。华为的盘古NLP大模型是业界首个超千亿参数的中文预训练大模型。关于文心一言的参数级别,目前尚无具体公开数据,但预计能突破万亿级别;阿里通义千问2.0正式发布千亿参数级别的大模型通义千问2.0;腾讯混元大模型是一款由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens;科大讯飞星火大模型具备超千亿参数规模。

在落地应用方面,微软更新了Office套件,提供智能写作和自动文档生成功能。在医疗保健、金融服务、通信行业等领域取得进展。华为的盘古大模型已应用在金融、制造、医药研发、煤矿、铁路等行业。阿里的通义千问在电商行业和智能家居领域有较好的应用。腾讯混元大模型在专业设计场景中有较好的应用。百度的文心一言在金融、医疗健康、旅游、专业咨询服务、内容创作与AI作画方面的应用展示了其在跨模态、跨语言情景下的深度语义理解与生成能力。

目前大模型的开源主要集中在算法、API服务、开发工具的使用上。数字经济应用实践专家骆仁童博士表示,未来需要构建全栈化的开放生态,打造标准算法集、大模型平台、大模型数据集等于一体的开放平台。

大模型的应用之路才刚刚开启,场景需求碎片化、研发和应用计算成本高以及长尾场景数据较少等问题依然存在。从实验室场景中训练出的模型算法在真实场景中的表现还需要进一步观察。尽管前路漫漫,但更多的期待仍然值得拥有,更多的惊喜仍就值得等待。

目前已经公布的大模型>>

  • 华为、字节跳动相继入局大模型,当前的AI赛况如何?

  • 京东加入牌局,为何“言犀”大模型只针对数智供应链产业?

  • 腾讯参战AI人工智能大模型,能在“百智大战”的混战中能杀出重围吗?

  • 百度阿里、商汤华为推出AI大模型,新一轮的AI大战是概念炒作还是产业风口?| 深度详盘

  • 百度AI焕新,多业务智能化升级,营销和办公场景将如何变革?

  • 20.65 亿!王兴的美团正式收购王慧文的 AI 公司光年之外

  • 海外人工智能AI大模型的行业格局 | 深度盘点

商道童言(Innovationcases)欢迎点赞和分享哦!~~

免费电子书:结构化思维 | 荆棘商途 | 年度十词 创新企业案例 | 区块链金融


数字经济应用实践专家 骆仁童主讲课程

人工智能:《AI趋势》《ChatGPT》

数字应用:《区块链》《元宇宙》《大数据》

数字中国:《智慧城市》《数字政府》《智慧建筑》《智慧交通》

数字化转型:《制造业数转》《零售业数转》《中小企业创新》

产业数字化:《烟草数转》《银行金融科技》《电力能源互联网》

宏观与趋势:《数字经济》《2024宏观》《双碳》

思维与技能:《数字化思维》《组织变革》

创新与创业:《创业导师》《商业模式》




Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1