最癫OpenAI爆料者竟是AI智能体？？CEO出来认领，网友炸锅

作者：量子位发布时间：2024-08-17

梦晨发自凹非寺

量子位 | 公众号 QbitAI

如果你这几天在𝕏/推特上关注AI消息，那很大概率见过这个“草莓哥”账号。

头像是电影《Her》里的男主，昵称是三颗草莓，要素拉满。不知疲倦一天24小时在线水贴，内容多是OpenAI下一代模型爆料消息，时准时不准……

自从OpenAI奥特曼和草莓哥配合互（炒）动（作）过之后，不管你愿意不愿意看，推荐算法都会确保ta出现在你的时间线上。

昨天，草莓哥声称OpenAI将有大动作，大家是非常期待的。

而且刚好又到了谷歌开发布会的时间，OpenAI拿出什么消息来抢头条也是很合理的吧。

但时间到了大家发现，没有GPT-5，也没有草莓/Q*，也没有Sora公测……OpenAI只是发了新版大模型代码能力测试基准。

就在网友们的耐心被耗光的时候，剧情反转来了。

创业公司MultiOn AI的创始人Div Garg现身认领：

草莓哥账号其实是我们家最先进的AI Agent控制的，快来和它在线互动吧。

网友一下子炸锅了：

“要么这就是当前最好的AI Agent，要么这家公司参与炒作，把公司声誉全毁了。”

斯坦福博士休学创业，估值7亿元

先来说说MultiOn AI这家公司，专注于构建AI智能体。

旨在自动化日常任务和操作网页，例如从电商平台买手纸或安排日程表。

今年6月，有消息称MultiOn将完成2000万美元（约1.4亿元）融资，估值约1亿美元（约7.1亿元）。

创始人Div Garg，斯坦福大学读CS博士期间休学创业，在Uber、谷歌、苹果、英伟达都有实习经历。

他们最新推出的智能体产品Agent Q，号称拥有做计划和纠正自己错误的能力，可以跨站点浏览、填写表单，zero-shot表现比Llama 3基线提升340%。

与此同时，也发布了与斯坦福团队合作的相关研究论文，

关键创新点是AlphaGo同款蒙特卡洛树搜索算法结合DPO微调。

总之呢，产品和论文看起来还挺正经的。

就是CEO声称草莓哥账号是AI控制的这一点，网友们还是不太买账。

最近围绕AI的消息太多太乱，大家已经不知道该相信什么了。

不过也有人认为，草莓哥的账号与MultiOn公司成立时间对的上，用户名iruletheworldmo最后的“mo”可以是MultiOn的缩写。

但即使是真的，也有很多人批评这家公司的做法，没有带来什么好影响，而是浪费了很多人时间。

AI越狱大师Pliny看不惯这种做法，发出了最后通牒：

给你们15分钟时间，要不拿出决定性的证据，要么坦白真相，不然就把你家智能体的系统提示词公布在GitHub上。

时间到了，Div Garg并没有回应，反而删除了其中一条声称草莓哥账号由AI控制的两条发言，另一条还保留着。

Pliny也如约发布了提示词。

One More Thing

在国内大家睡觉的这段时间，AI圈发生了很多事。

除了MultiOn的闹剧之外，谷歌发布了对标GPT-4o高级语音模式的Gemini Live语音聊天机器人。

OpenAI则出了两招来回应：

发布最新代码能力基准测试SWE-Bench Verified，给“AI程序员”们出了一套更合适的考试题。

OpenAI在测试中发现原版基准中有一些AI不可能或很难解决的任务，从而导致基准普遍低估了当前模型的自主软件工程能力。

此前SWE-Bench原版作者姚班学霸姚顺雨已经毕业入职OpenAI，这次OpenAI也和普林斯顿原始团队进行了合作，在新版本中修正了这些问题，可以提供更准确的评估。

目前新版基准测试已经开源在GitHub上。

同时在大模型竞技场上，GPT-4o的最新版本反超谷歌Gemini-1.5-Pro的试验版本，重新夺回第一的位置。

OpenAI和谷歌的AI大战，还将继续……

参考链接：

[1]https://x.com/MultiOn_AI/status/1823412701441482959

[2]https://x.com/ai_for_success/status/1823447309008490730

[3]https://openai.com/index/introducing-swe-bench-verified/

— 完—

量子位年度AI主题策划正在征集中！

欢迎投稿专题一千零一个AI应用，365行AI落地方案

或与我们分享你在寻找的AI产品，或发现的AI新动向

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

近期资讯

上海锋机五金模具取得一种高压泵组用便于清洁的水箱专利，后期维护少

金融界2024年12月30日消息，国家知识产权局信息显示，上海锋机五金模具有限公司取得一项名为“一种高压泵组用便于清洁的水箱”的专利，授权公告号CN222220619U，申请日期为2024年11月。

金融界 2024-12-30

天马 Micro LED 产线顺利全制程贯通：无尺寸限制的无边框拼接

IT之家12月30日消息，天马微电子宣布，天马MicroLED产线今日在厦门成功实现全制程贯通。本次全制程贯通仪式现场点亮的是天马自主研发生产的PID标准显示单元模块。该标准模块以天马LTPS基玻璃背板为基础，利用天马MicroLED产线自研的全激光巨量转移工艺，可打破传统显示尺寸限制，实现无尺寸限制的无边框拼接显示。

IT之家 2024-12-30

ThinkPad X1 Carbon Aura打破技术壁垒，树立AI PC新典范

随着各大电脑厂商陆续推出并迭代自身的AIPC产品，用户对AIPC的期望也在不断提升，从单纯的性能提升，到多场景智能化体验的升级，再到多设备的智能协作，用户愈发注重个性化需求的满足与高效便捷的交互方式。它以120TOPS的AI算力、重量低于1千克（986克）的轻薄设计，以及行业首创的跨生态协作能力，树立了AIPC行业发展的新标杆。

砍柴网 2024-12-30

曝vivo明年将推出MR设备部分指标和体验超Vision Pro

【CNMO科技消息】12月30日，CNMO注意到，博主“数码闲聊站”披露了vivo明年的一系列动向。vivo将推出新一代自研影像芯片，而首款搭载该芯片的新机无疑是vivoX200Ultra。据悉，vivoX200Ultra在影像方面将主要聚焦于长焦拍摄和视频录制。

手机中国 2024-12-30

任天堂Switch 2据悉或于明年3月发售

钛媒体快报 2024-12-30

智能恒温，海尔燃气热水器JSLQ27-16E5DLPCU1：补贴下的节能新贵

#年货节好物集市#海尔作为全球知名的家电品牌，其燃气热水器产品一直以高品质、创新技术和卓越性能著称。海尔燃气热水器在市场上的表现尤为突出，凭借其超一级能效、节能增压、变频水伺服等先进技术，为用户提供了舒适、节能、安全的洗浴体验。海尔燃气热水器不仅在技术上不断创新，更在用户体验上追求极致，致力于为用户提供更加舒适、节能、安全的洗浴体验。

小米地瓜 2024-12-30

天马Micro-LED产线顺利全制程贯通

2024年12月30日，天马Micro-LED产线在厦门成功实现全制程贯通。本次全制程贯通仪式现场点亮的是天马自主研发生产的PID标准显示单元模块。该标准模块以天马LTPS基玻璃背板为基础，利用天马Micro-LED产线自研的全激光巨量转移工艺，可打破传统显示尺寸限制，实现无尺寸限制的无边框拼接显示。

证券时报 2024-12-30

讯飞智作亮相央视首届“科晚”，打造“AI张腾岳”三分钟炫技3种语言

AI能写文章、能画画、能聊天，这些已经不再新鲜。飞董事长刘庆峰用一系列精彩的现场演示，向全国观众展现了人工智能赋能千行百业的创新实践，看AI技术如何真正走进百姓生活、服务社会发展。

中国财富网 2024-12-30

Turbo 4来了！REDMI送上最有创意的邀请函：超级能效大礼包

快科技12月30日消息，博主体验more晒出了REDMITurbo4邀请函——超级能效大礼包，包含一个开心果抱枕和四袋三只松鼠开心果。据悉，和REDMIK80“狂暴辣”的谐音梗一样，REDMITurbo4的谐音梗是“超级能效”（超级能笑），突出了REDMITurbo4的卖点——领先的能效。

快科技 2024-12-30

昆明理工大学举行中外师生文艺晚会

中新网云南新闻12月28日电(记者缪超)27日晚，“梦想起航世界同行”——昆明理工大学第十二届“红土情·世界风”中外师生文艺晚会在呈贡校区红土会堂举行。

中国新闻网 2024-12-30

最癫OpenAI爆料者竟是AI智能体？？CEO出来认领，网友炸锅

推荐体验

相关资讯

大涨！大涨！网友炸锅

Windows 12 最新爆料，爆料人竟是 Intel

人工智能ChatGPT变身爆料者？魅族 20 全系参数都给爆出来了？

ChatGPT发癫已读乱回，网友：“高速运转的机械”AI版？

53页PDF爆料OpenAI“AGI时间表”，爆料者：马斯克诉讼搅了局

近期资讯

上海锋机五金模具取得一种高压泵组用便于清洁的水箱专利，后期维护少

天马 Micro LED 产线顺利全制程贯通：无尺寸限制的无边框拼接

ThinkPad X1 Carbon Aura打破技术壁垒，树立AI PC新典范

曝vivo明年将推出MR设备部分指标和体验超Vision Pro

任天堂Switch 2据悉或于明年3月发售

智能恒温，海尔燃气热水器JSLQ27-16E5DLPCU1：补贴下的节能新贵

天马Micro-LED产线顺利全制程贯通

讯飞智作亮相央视首届“科晚”，打造“AI张腾岳”三分钟炫技3种语言

Turbo 4来了！REDMI送上最有创意的邀请函：超级能效大礼包

昆明理工大学举行中外师生文艺晚会

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响