讯飞星火大模型，明年对标GPT4 | 蓝媒GPT

作者：蓝媒汇发布时间：2023-12-29

科大讯飞：星火大模型明年上半年全力对标GPT4

在近日对媒体的回复中，科大讯飞董秘江涛表示，科大讯飞今年启动了更大参数的大模型训练，全力对标OpenAI的GPT4，将在明年上半年全力实现这一目标，需要进行万亿浮点参数的训练；为了打造每个人的助手，需要AI人设，需要改进主动问答方面，特别是启发式、引导性的提问。

董事长刘庆峰表示，在这个过程中，公司会面临一些挑战，包括如何提高模型的性能、如何降低成本、如何更好地满足行业需求等。

MiniMax将发布国内首个MoE大模型，也是对标GPT4，

12月28日，中国大模型创业企业MiniMax副总裁魏伟，在数字中国论坛成立大会暨数字化发展论坛的分论坛上称，公司将于近期发布国内首个基于MoE（Mixture-of-Experts专家混合）架构的大模型，对标GPT-4。

资料显示，作为深度学习技术之一，MoE可以通过将多个模型直接结合在一起，加快模型训练的速度，从而获得更好的预测性能。来自谷歌UC 伯克利、MIT 等机构的研究者联合发表的一篇论文已经证实了该架构与指令调优的结合，使大型语言模型性能大幅提升的可能。

王小川：国产大模型已经能够替代国外产品

在近期接受采访时，百川智能创始人、首席执行官王小川表示，面对过去一年大模型的飞速发展，中国公司经历了恐慌期、投入期和迭代期，目前国产模型在某些方面，尤其是开源模型领域，是能够替代国外产品的。

在他看来，国内很多大模型在技术层面已经对齐了GPT-3.5，今年中国公司将更多精力放在了大模型本身，明年会开始在应用层面进行突破，百川智能正在研发几款AI应用，主要针对健康、快乐、个人助理方向，计划于明年推出。

王小川预计，未来能做ToB、较大参数模型，同时还能做ToC的超级应用公司不会有很多家，最后国内这样的玩家在五家左右。

周鸿祎预测人工智能发展趋势，称多数人的使命是用好AI而非制造AI

在清华大学演讲中，360创始人周鸿祎预测了2024年人工智能产业的发展趋势，他认为：第一，大模型不会垄断，不像操作系统全世界就那么几套，它的发展路径更像PC，未来会无处不在。第二，明年小规模的大模型将很快搭载在手机和各种物联网设备上，而不仅工作在云端。而且明年汽车上可能会部署出来更多的大模型。第三，多模态将成为国产大模型的标配，目前国产大模型还是以文字为主，明年也将向多模态方向发力；第四，国内会出现很多垂直大模型，走进百行千业，向产业化方向发展。

谈及当下人和AI的关系，周鸿祎表示，AI不会淘汰人，但不熟悉AI的人会很可能被熟悉AI的人淘汰。绝大多数人这辈子重要的是用好AI而不是造AI，就像很多人只是把电脑、手机用好就可以了，不需要去研发手机芯片；

中国信通院发布“方升”大模型基准测试体系

本周，中国信息通信研究院发布“方升”大模型评测体系，旨在建立业界大模型基准测试统一的“度量衡”。“方升”测试体系涵盖大模型基准测试的关键四要素，即测试指标、测试方法、测试数据集和测试工具，目前已形成《大规模预训练模型基准测试-总体技术要求》标准。

Lanmeih/今日话题

你期待国产大模型增强哪些功能？

咱们评论区聊聊~