40%算力训练效果比肩GPT-4，实测DeepMind联创大模型创业新成果

作者：量子位发布时间：2024-03-08

GPT-4 英伟达微软融资

大模型竞赛，又杀出一匹黑马——

Inflection-2.5，由DeepMind联创Mustafa Suleyman的大模型初创公司打造。

只用40%的计算资源训练，表现就超过了GPT-4的九成，尤其擅长代码和数学。

而早期的Inflection模型，训练时只消耗了4%的计算资源，就达到了GPT-4表现的72%。

以Inflection模型为基础，该公司还推出了网页端对话机器人Pi，主打“高情商”和“个性化”，还支持中文。

自诞生以来，Pi的最高日活达到了100万，累计产生了40亿条消息，平均对话时长来到了33分钟。

而随着这次基础模型的升级，Pi也迎来了它的新版本。

那么，Inflection，或者说Pi，表现到底有没有那么强，量子位进行了一番实测。

01 无需登录即可使用

打开Pi的页面，映入眼帘的是这样一个极简界面，而且还可以不用登录，直接点击Next。

连续Next几次后，输入希望Pi称呼我们的方式。

之后是选择声音和推荐话题，直接跳过就可以了，然后就进入正式的聊天界面了。

简单测试发现，Pi支持中文对话，既然如此那就先把弱智吧Benchmark给安排上。

第一题，老鼠生病了可以吃老鼠药治好吗，Pi成功解答。

再来一道“陷阱”题，这次依旧没有上当。

两道问题过后，虽然没有出现什么戏剧性效果，但看起来对中文也是有一定的理解了。

接下来就重点看看官方宣称“尤其擅长”的数学和代码能力。

首先是一道涉及动态规划的编程题目。

Pi给出的代码成功解决了这个问题，并且配有清晰的解释。

接下来再提升一下难度看看，让其分析一个数字的阶乘中末尾有多少个0。

Pi给出的代码不仅正确，而且简洁高效，运行速度超过了LeetCode上73.8%的用户。

最后再来增加一下难度，以一道47.5%通过率的题目结束代码部分的测试。

看完代码，再来测测Pi的数学能力怎么样，让它做做关于导数的题目：

求出函数f(x)=x³+2x²-1的极值点

解答完全正确，而是十分详细。

当然要想数学好，逻辑思维是必不可少的，所以我们在常规的数学题之外，又用一道经典的题目考验了一下的Pi逻辑思维，结果还不错。

通过Pi的表现，可以看出其背后的Inflection-2.5模型的确可圈可点。

而从官方自己公布的测试数据来看，无论是综合能力还是各个子项，Inflection-2.5的表现都紧随GPT-4。

以数学和代码为例，Inflection-2.5在MATH、HumanEval等测试中都比1.0版本都有大幅飞跃。

在这些常规的数据集之外，Inflection还挑战了匈牙利高考数学试题和GRE物理测试，结果几乎与GPT-4打成平手。

更“刁钻”的，还有人专门用大模型难以理解的问题构建了一个BIG-Bench数据集，而Inflection-2.5挑战了其中的Hard子集，结果和GPT-4的差距不到一分。

那么，Inflection-2.5的背后，是怎样的一家公司呢？

02 DeepMind联创大模型创业

这家公司名叫Inflection AI，由DeepMind联创Mustafa Suleyman等人于2022年创立，目前共有70余人。

同样来自DeepMind的，还有资深研究员Karen Simonyan，现担任Inflection AI的首席科学家。

此外，LinkedIn联创Reid Hoffman也参与了Inflection AI的创立。

创立以来，Inflection AI已经获得了来自英伟达、微软、比尔盖茨等巨头的共计15亿美元的融资。

目前，基于Inflection的Pi还是免费的，但CEO Suleyman也表示，一直用爱发电不现实，长久地看以后还是要收费。

想要体验的朋友，可能要抓紧时间了~

参考链接：

[1]https://inflection.ai/inflection-2-5

[2]https://www.axios.com/2024/03/07/inflection-ai-chatgpt-openai-comparison

本文来自微信公众号“量子位”（ID:QbitAI），作者：关注前沿科技，36氪经授权发布。

近期资讯

安在软件 2024-12-27

消除嘈杂,享受静谧时光 - 览邦LairPods Pro+降噪耳机的安静魔力

在这个喧嚣的时代,很多人都渴望找到一个属于自己的静谧空间,远离外界的噪音干扰,沉浸在内心的宁静之中。而这个梦想,正是览邦LairPods Pro+降噪耳机为我们实现的。记得第一次戴上这款耳机,我就被它的"静谧魔力"所征服。只见我轻轻打开降噪开关,耳畔的嘈杂声仿佛一下子消失殆尽,取而代之的是一片宁静祥和。无论我身处地铁、公交还是繁华街道,耳边都只有悦耳动听的音乐,以及内心深处的平静。开启降噪模式后，耳机的解析力更是得到了加强。在低频下潜方面更加凝练有力，同时对中高频的细节处理也极为到位，呈现出更加干净细腻的

bili_86176276645 2024-12-27

百元头戴式蓝牙耳机推荐：西圣H1亲测好用

冬天到了，上下班戴着开放式蓝牙耳机听歌，开始觉得，有点冻地耳朵扛不住了，戴上护耳又影响听歌效果。突然就想起来头戴式蓝牙耳机，防风护耳、听歌运动，鱼和熊掌也可兼得。最近上手了这款西圣H1头戴式蓝牙耳机，使用了一段时间后，觉得还不错，非常值得推荐。首先，产品好不好，开箱必不可少。拿到产品是一个白色的方向大盒子，正面有素描的头戴式耳机样张，左上方是“XISEM西圣”的LOGO，有下角圈出了主动降噪的特点。背面是产品详情，可以看到型号“XISEM-H1”,可以看到蓝牙15米，能听歌20小时，续航还不错

科技观察员 2024-12-27

内网部署智邦、用友、金蝶等ERP系统，如何快速安全远程访问？

办公系统中往往存储着企业的核心运营数据，例如ERP系统就涵盖了财务信息、客户资料以及供应链等敏感数据。一旦这些数据发生泄露，可能会给企业带来不可估量的损失。因此许多企业倾向于将它们部署在公司内部的服务器上，而非云服务器，以确保这些重要、敏感数据安全，目前智邦、用友U8、金蝶K3、简道云等ERP系统均可支持局域网部署。但随之而来的挑战是如何满足远程分支机构和外出员工的访问需求。传统方案是使用运营商专线或VPN的形式，不仅网络成本高昂，还要专业IT人员花费大量时间部署和维护，无疑是增加了企业的运营

贝锐科技 2024-12-27

安天AVL SDK反病毒引擎升级通告（20241221）

本着安全能力透明化，易达、易用、可验、可感的原则，安天每周对公众发布AVL SDK反病毒引擎周度更新和能力全集情况。一、周度更新情况统计周期：2024年12月14日~2024年12月20日安天AVL SDK反病毒引擎本周共发布病毒库更新84次，日均更新12次，新增可检测恶意代码家族44个，新增可检测恶意代码变种6,186个，新增检测规则19,771条。下表为新增可检的恶意代码家族TOP5清单：（按照周期内家族样本HASH数统计）更多相关内容请访问计算机病毒百科virusview.net二、检测能力全集

安天科技 2024-12-27

来高科技（天津）有限公司携先进设备亮相2024 AI4S论坛

以创新科技指引未来，助力科学计算与交叉学科发展随着人工智能技术的飞速发展及其在科学计算领域的深度融合，一场旨在探索AI for Science (AI4S)前沿成果和促进学术交流的盛会——“2024 AI4S Forum: Scientific Computing, Inverse Problems and Applications”(2024 年AI4S论坛科学计算、反问题及其应用)于12月21日至23日在天津师范大学隆重举行。本次会议吸引了来自国内外众多知名学者和科研机构的关注与参与。在这场高水平的学

来高3D 2024-12-27

40%算力训练效果比肩GPT-4，实测DeepMind联创大模型创业新成果

01 无需登录即可使用

02 DeepMind联创大模型创业

推荐体验

相关资讯

GPT-5正秘密训练，DeepMind联创爆料，这模型比GPT-4大100倍

2000元训练比肩ChatGPT的开源大模型！GPT-4亲自盖章认证

商汤“大模型超市”日日新4.0上新语言大模型比肩GPT-4

中文能力比肩GPT-4，国产大模型GLM-4上线

对标GPT-4！传谷歌发布Gemini，算力比训练GPT-4大5倍【附AIGC行业竞争分析】

近期资讯

外贸独立站建站：如何选择合适的建站服务？

RFID智能文件柜：提升档案管理效率的新利器

GB 15631-2008 特种火灾探测器

超实用的 Win10 录屏软件推荐，6 款任你选！用了你就知道了！

企业安全的利器：七款热门网络准入控制产品功能测评

消除嘈杂,享受静谧时光 - 览邦LairPods Pro+降噪耳机的安静魔力

百元头戴式蓝牙耳机推荐：西圣H1亲测好用

内网部署智邦、用友、金蝶等ERP系统，如何快速安全远程访问？

安天AVL SDK反病毒引擎升级通告（20241221）

来高科技（天津）有限公司携先进设备亮相2024 AI4S论坛

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响