清华“学霸”，官宣重磅消息！

作者：证券时报发布时间：2024-03-19

来源：券商中国

A股市场又有热闹的事情。

中国人工智能行业传来重磅消息。据通用人工智能创业公司——月之暗面官方微信公众号最新消息，支持200万字上下文的 Kimi 智能助手即日启动“内测”。根据机器之心数据显示，尚未上线的GPT-4.5 Turbo上下文窗口指定为25.6万个token（指文本中最小的语义单元），能同时能够处理约 20万个单词，Kimi此次升级后长文本能力为其10倍。

在二级市场上，投资大模型的公司爆发。电广传媒连续拉板，九安医疗亦有不错表现。与此同时，应用层面上，福昕软件、金山办公、万兴科技等亦明显强于大盘。在英伟达股票昨晚表现不佳的背景之下，这类股票依然如此强势，着实不易。

那么，该事件的影响究竟会有多大呢？

月之暗面大爆发

最近，记者一直在试用Kimi，综合用下来，发现一些功能并不比ChatGPT4.0差。

而就在昨天，Kimi的开发商月之暗面发布了最新消息。Kimi 智能助手2023 年10月初次亮相时，凭借约20万汉字的无损上下文能力，帮助用户解锁了很多新的使用场景，包括专业学术论文的翻译和理解、辅助分析法律问题、一次性整理几十张发票、快速理解API开发文档等，获得了良好的用户口碑和用户量的快速增长。“不到半年时间过去，我们今天宣布 Kimi 智能助手在长上下文窗口技术上再次取得突破，无损上下文长度提升了一个数量级到 200 万字。”

从20万字到200万字，由于没有采用常规的渐进式提升路线，月之暗面团队遇到的技术难度也是指数级增加的。为了达到更好的长窗口无损压缩性能，他们的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发，不走“滑动窗口”“降采样”等技术捷径，攻克了很多底层技术难点。

根据机器之心数据显示，尚未上线的GPT-4.5 Turbo上下文窗口指定为25.6万个token，能同时能够处理约 20万个单词，Kimi此次升级后长文本能力为其10倍。这不由得让人振奋。

月之暗面创立于2023年3月，致力于寻求将能源转化为智能的最优解，通过产品与用户共创智能。创始团队核心成员参与了Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发，多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。

月之暗面创始人为90后“学霸”杨植麟。资料显示，在清华大学求学时，杨植麟师从清华大学计算机系知识工程实验室（KEG）带头人，智源研究院学术副院长、悟道项目负责人唐杰教授。

2015年，杨植麟进入卡内基梅隆大学（CMU）语言技术研究所（LTI），跟随苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen攻读博士学位。毕业后，杨植麟曾效力于谷歌大脑研究院和Meta（Facebook）人工智能研究院。

杨植麟曾在接受采访时表示，无论是文字、语音还是视频，对海量数据的无损压缩可以实现高程度的智能。

影响力多大？

月之暗面风头无两，隐隐有成人工智能龙头之势。数据显示，该公司旗下Kimi访问量近期暴涨。最新周访问量创新高，3月8日-3月14日访问量183万，环比增加45%。

公开资料显示，月之暗面（Moonshot AI）成立三个月就完成第一轮融资，具体金额超过2亿美元。在这轮融资中，投资方包括知名的风险投资机构红杉中国、真格基金和砺思资本等。这轮融资完成后，月之暗面的估值超过了15亿美元。

2023年10月完成第二轮融资，获得了来自红杉中国、今日资本、砺思资本等投资机构的近20亿元人民币的投资。这轮融资之后，月之暗面的估值达到了约25亿美元，进一步巩固了其在国内大模型领域的头部企业地位。

今年2月，“月之暗面”完成第三轮金额超过10亿美元的融资。这轮融资的规模之大，也刷新了国内AI领域最大单笔融资纪录。参与这次融资的投资方包括了红杉中国、小红书、美团、阿里巴巴等知名企业和投资机构。

这也带动一些投资人工智能的创投企业股价飙升。比如，最近九安医疗就连续上涨。3月13日，电广传媒通过官方公众号发文称，旗下达晨财智已经完成对视频大模型公司爱诗科技亿级A1轮融资领投，光源资本担任独家财务顾问，资金将主要用于底层视频大模型的技术研发及团队搭建等方面。该公司股价亦连续涨停。今天早盘，应用端的股票亦大幅上涨，福昕软件、金山办公、万兴科技等明显强于大盘。

天风证券缪欣君认为，2023年10 月Kimi初次亮相时就已拥有20万汉字的无损上下文能力，此次升级200万字上下文窗口，大模型无损上下文长度的数量级提升，在相同成本、相同设备情况下，模型响应速度提升了3倍左右，也会进一步帮助打开对AI应用场景的想象力，包括完整代码库的分析理解、可以自主帮人类完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等等。

面对同质化严重的大模型竞争，更长的上下文长度可以为大模型应用带来全新的篇章。随着此次Kimi长文本能力突破200万也意味着能够完成更长和更复杂的任务。国内长文本能力打开有望利好文字类AI应用。

责编：叶舒筠

校对：杨立林