当前位置:首页|资讯|百度|李彦宏|文心大模型|GPT-4

【e公司观察】BAT大模型全部官宣跨过基准线 下一步锚点在于“上天入地”

作者:证券时报发布时间:2023-10-31

原标题:【e公司观察】BAT大模型全部官宣跨过基准线 下一步锚点在于“上天入地”

截至10月31日,BAT三大厂的大模型,均已明确至少突破了GPT3.5的基准线。经过7个月左右的历练,以及多轮升级迭代,意味着国产通用大模型都已迎来标志性时刻。

最先发出超越信号的是百度。7月下旬,百度集团副总裁吴甜就表示,新版本文心一言3.5已超越ChatGPT 3.5。在10月下旬举办的百度世界大会上,李彦宏正式发布文心大模型4.0,并表示其在理解、生成、逻辑和记忆能力上,综合能力与GPT-4相比毫不逊色。

随后向市场宣布超越消息的腾讯。10月前后,混元大模型升级,腾讯官宣其中文能力整体超过GPT3.5。

阿里云姗姗来迟。在10月31日云栖大会上,正式发布千亿级参数大模型通义千问2.0。通过测评,其综合性能超过GPT-3.5,正在加速追赶GPT-4。

BAT三大厂之所以出现前述排序,与入局大模型的时间节点、资金投入规模等因素有关;同时还与自身业务属性、战略定位和AI需求的迫切性紧密关联。在三家大厂中,百度是最有AI商业化需求的企业,也是最早入局AI赛道的公司。

除了大厂大模型之外,商汤“商量SenseChat2.0”测评表现均领先ChatGPT,部分已十分接近GPT4的水平;科大讯飞大模型也宣布对标GPT4。这表明,大厂之外,其他AI赛道的头部公司也在加速竞逐。

对于国产大模型的这种拉齐、超越、对标,一方面应该持有肯定和鼓励态度,背后折射出科技型企业对于先进技术的不断探索与投入。另一方面也应保持理性,国内大模型虽然通过了GPT3.5“基准线”,但部分“超过”只是基于各自平台和局部的指标,技术层面的全面拉齐还有一些短板要补。

“基准线”突破后,“百模大战”系统性能力的比拼才刚刚开始。下一步的方向将是加速走出象牙塔,在效果、成本支出、商业化三方面,找寻到平衡点,借助大模型把生产力推升新台阶。从这个角度看,“大而强”只是大模型竞逐的一维。

除了技术层面“上天”之外,还需要尽快“入地”。短中期来看,如何实现将大模型与产业化、与万物应用的无缝连接,将是一个持久功课。而从长期来看,大模型的归途,不仅是模仿人类,而更是帮人类突破新极限。

虽然目前仍未知国产大模型竞逐的终局,但是有一些发展方向已经可以初步确定,包括更加精细化的语言表达能力、更加多模态的应用场景、更加人性化的交互方式等。这个过程面临着不少挑战,至少体现在如下方面。

一方面,大模型体积大,训练难度高,算力要求同步抬升。这需要加速突破整个AI产业链条上游科技短板的掣肘。

另一方面,数据规模也是一个大问题。不仅收集、挖掘、筛选、清洗是一个大工程,而且数据的安全和隐私等问题,也需要更好的解决方案。

从后一个维度看,除了软件类和云服务类头部企业在竞逐大模型之外,包括联想、小米等硬件厂商也在涌入大模型,除了以场景化、隐私化、轻量化作为切入点之外,数据安全因素也是重要的立足点。

这给我们带来的启示是,在大模型落地的过程中,除非用户愿意把数据给到公有云,否则数据隐私、安全等挑战不得不提前考量。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1