当前位置:首页|资讯|清华|人工智能|GPT-4

清华“学霸”,官宣重磅消息!

作者:证券时报发布时间:2024-03-19

原标题:清华“学霸”,官宣重磅消息!

来源:券商中国

A股市场又有热闹的事情。

中国人工智能行业传来重磅消息。据通用人工智能创业公司——月之暗面官方微信公众号最新消息,支持200万字上下文的 Kimi 智能助手即日启动“内测”。根据机器之心数据显示,尚未上线的GPT-4.5 Turbo上下文窗口指定为25.6万个token(指文本中最小的语义单元),能同时能够处理约 20万个单词,Kimi此次升级后长文本能力为其10倍。

在二级市场上,投资大模型的公司爆发。电广传媒连续拉板,九安医疗亦有不错表现。与此同时,应用层面上,福昕软件、金山办公、万兴科技等亦明显强于大盘。在英伟达股票昨晚表现不佳的背景之下,这类股票依然如此强势,着实不易。

那么,该事件的影响究竟会有多大呢?

月之暗面大爆发

最近,记者一直在试用Kimi,综合用下来,发现一些功能并不比ChatGPT4.0差。

而就在昨天,Kimi的开发商月之暗面发布了最新消息。Kimi 智能助手2023 年10月初次亮相时,凭借约20万汉字的无损上下文能力,帮助用户解锁了很多新的使用场景,包括专业学术论文的翻译和理解、辅助分析法律问题、一次性整理几十张发票、快速理解API开发文档等,获得了良好的用户口碑和用户量的快速增长。“不到半年时间过去,我们今天宣布 Kimi 智能助手在长上下文窗口技术上再次取得突破,无损上下文长度提升了一个数量级到 200 万字。”

从20万字到200万字,由于没有采用常规的渐进式提升路线,月之暗面团队遇到的技术难度也是指数级增加的。为了达到更好的长窗口无损压缩性能,他们的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发,不走“滑动窗口”“降采样”等技术捷径,攻克了很多底层技术难点。

根据机器之心数据显示,尚未上线的GPT-4.5 Turbo上下文窗口指定为25.6万个token,能同时能够处理约 20万个单词,Kimi此次升级后长文本能力为其10倍。这不由得让人振奋。

月之暗面创立于2023年3月,致力于寻求将能源转化为智能的最优解,通过产品与用户共创智能。创始团队核心成员参与了Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发,多项核心技术被Google PaLM、Meta LLaMa、Stable Diffusion等主流产品采用。

月之暗面创始人为90后“学霸”杨植麟。资料显示,在清华大学求学时,杨植麟师从清华大学计算机系知识工程实验室(KEG)带头人,智源研究院学术副院长、悟道项目负责人唐杰教授。

2015年,杨植麟进入卡内基梅隆大学(CMU)语言技术研究所(LTI),跟随苹果公司AI负责人Ruslan Salakhutdinov和Google AI智能首席科学家William W. Cohen攻读博士学位。毕业后,杨植麟曾效力于谷歌大脑研究院和Meta(Facebook)人工智能研究院。

杨植麟曾在接受采访时表示,无论是文字、语音还是视频,对海量数据的无损压缩可以实现高程度的智能。

影响力多大?

月之暗面风头无两,隐隐有成人工智能龙头之势。数据显示,该公司旗下Kimi访问量近期暴涨。最新周访问量创新高,3月8日-3月14日访问量183万,环比增加45%。

公开资料显示,月之暗面(Moonshot AI)成立三个月就完成第一轮融资,具体金额超过2亿美元。在这轮融资中,投资方包括知名的风险投资机构红杉中国、真格基金和砺思资本等。这轮融资完成后,月之暗面的估值超过了15亿美元。

2023年10月完成第二轮融资,获得了来自红杉中国、今日资本、砺思资本等投资机构的近20亿元人民币的投资。这轮融资之后,月之暗面的估值达到了约25亿美元,进一步巩固了其在国内大模型领域的头部企业地位。

今年2月,“月之暗面”完成第三轮金额超过10亿美元的融资。这轮融资的规模之大,也刷新了国内AI领域最大单笔融资纪录。参与这次融资的投资方包括了红杉中国、小红书、美团、阿里巴巴等知名企业和投资机构。

这也带动一些投资人工智能的创投企业股价飙升。比如,最近九安医疗就连续上涨。3月13日,电广传媒通过官方公众号发文称,旗下达晨财智已经完成对视频大模型公司爱诗科技亿级A1轮融资领投,光源资本担任独家财务顾问,资金将主要用于底层视频大模型的技术研发及团队搭建等方面。该公司股价亦连续涨停。今天早盘,应用端的股票亦大幅上涨,福昕软件、金山办公、万兴科技等明显强于大盘。

天风证券缪欣君认为,2023年10 月Kimi初次亮相时就已拥有20万汉字的无损上下文能力,此次升级200万字上下文窗口,大模型无损上下文长度的数量级提升,在相同成本、相同设备情况下,模型响应速度提升了3倍左右,也会进一步帮助打开对AI应用场景的想象力,包括完整代码库的分析理解、可以自主帮人类完成多步骤复杂任务的智能体Agent、不会遗忘关键信息的终身助理、真正统一架构的多模态模型等等。

面对同质化严重的大模型竞争,更长的上下文长度可以为大模型应用带来全新的篇章。随着此次Kimi长文本能力突破200万也意味着能够完成更长和更复杂的任务。国内长文本能力打开有望利好文字类AI应用。

责编:叶舒筠

校对:杨立林

版权声明


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1