OpenAI又搞大事儿了!
周四,OpenAI官宣,从北京时间周五凌晨2点开始,将在未来的12天进行12场直播,你没看错,每个工作日都会进行一次直播,称将发布一些“大大小小的新东西”。
一下子就把市场的【期待值】拉满了,受此影响,AI相关多只个股再次持续大涨!
OpenAI满血版o1,究竟多强?
北京时间12月6日凌晨,第一场直播来了,首批王炸震撼来袭:OpenAI发布了“满血版”推理模型o1。
此前9月份,OpenAI发布o1-preview版本时,就曾对o1的技术思路进行过介绍:o1是使用大规模“强化学习”训练并使用“思维链”进行推理的系列模型。
据研究人员NoamBrown当时发布的社交内容,即使是当时已经公开的o1版本(非满血版o1),不但具有了奥数金牌潜在能力,在物理、生物、化学问题的基准测试中,更是直接超过了人类博士水平!
在美国数学邀请赛(AIME2024,国际数学奥林匹克竞赛(IMO)的资格考试,旨在测试美国最聪明高中数学学生的考试)中,GPT-4o只解决13%的问题,而o1推理模型得分高达83%,在Codeforces编程竞赛中,它的表现更进入了前89%的队列!
从2022年11月底,OpenAI发布ChatGPT3.5正式展现出“涌现”效果,到2023年3月15日推出GPT-4,9月24日推出具备多模态能力的GPT-4V,再到2024年5月14日推出GPT-4o,9月13日公开具备更强的推理能力的OpenAI o1-preview、o1-mini。
OpenAI大模型迭代至今,市场其实一直对o1满血版抱有高期待。
之前非满血版都那么强,现在“满血版”推理模型o1终于来了,能强到啥地步?
据介绍,o1“满血版”是世界上最智能的模型,比o1-preview更智能、更快速、功能更多(例如多模态),现已在ChatGPT中上线,即将在API中推出。
OpenAI著名研究科学家Noam Brown发帖表示,o1完全体不仅能数出【strawberry】里有几个【r】(此前的模型经常在这一问题上栽跟头),还能更进一步,写出“一篇不使用字母e的关于草莓的三段短文”(GPT-4o也尝试了这个任务,但第一个词就失败了)。
整体而言,o1 满血版是一款 更擅长编程、数学和写作的更快且更强大的推理模型。
OpenAI表示,OpenAI o1的思维更加简洁,因此响应时间比o1-preview更快。测试表明,o1的性能也优于o1-preview,将困难的现实问题的重大错误减少了34%。
此外,如果你升级到ChatGPT Pro,还可以体验到o1 pro模式,这是o1的一个更高级版本,与o1和o1-preview相比,o1 pro模式在数学、科学和编码等ML基准测试中表现更佳。特别是,更容易反映日常编程查询的编码竞赛题中,错误率降低了75%。
OpenAI推出世界最贵大模型,
持续烧钱困境的“解药”?
OpenAI技术人员表示:ChatGPT Pro的受众将是ChatGPT的高级用户,他们已经在数学、编程和写作等任务上将模型的能力推向极限。与大多数AI不同,o1和其他推理模型可以有效地进行自我事实检查,这有助于它们避免一些通常会使模型出错的陷阱。
众所周知,AI大模型创业,一直是一场“烧钱”的游戏,因为前期需要非常高昂的大模型训练成本,需要购买GPU&算力,服务器,数据等、以及巨额的运营成本、人工成本等。
据The information报道,OpenAI目前的年收入大约为34亿美元,而在人工智能训练和人员配备上预计消耗85亿美元,今年可能会血亏50亿美元。
具体来看,大模型的训练耗资巨大,需要巨额的算力与人力成本投入,OpenAI的成本主要分成推理成本、训练成本和人工成本三个部分。
推理成本,主要是租用微软服务器的支出,据悉日常仅仅为了维持ChatGPT的使用就需要70万美元/天,一年的推理成本总计接近40亿美元。
除此以外,训练成本主要用于支付数据费用,预计为30亿美元。人力成本方面,据OpenAI官网上的招聘岗位测算,每年公司要花费约15亿美元在这些高级AI人才身上。
OpenAI预计未来几年模型训练的计算成本可能还会大幅上升,对此,据The Information报道,OpenAI2026年的亏损将达到140亿美元,是今年预期亏损的三倍,OpenAI要到2029年才能盈利。
后面期待啥?
12天12场,目前只进行了第一场,后面还能期待啥。
据国泰君安研报,用户对OpenAI的视频生成、视频对话等功能期待较高。
OpenAI的文生视频模型Sora于今年2月16日首次公开,体现出高一致性、长达分钟级的视频时长等优势,但一直未见正式发布,OpenAI前首席技术官Mira在3月份的访谈中称Sora最快今年内开放公测。
此外,OpenAI还于5月14日对外公开其开发的高级语音功能和视频对话功能,7月31日开始向一小部分ChatGPTPlus用户推出高级语音模式,9月开始推广给所有付费用户,但视频通话功能一直未见实装。
此外,据网友猜测,GPT-4o模型被锁定的图像生成功能受关注,其早期演示效果出色且有视频分析能力;ChatGPT高级语音模式有望接入互联网实时搜索及连接摄像头分析现实世界;甚至有网友幻想看到o2模型或GPT-5o的预览,还有文本转语音工具和“操作员”AI代理框架虽预期明年发布,但也可能在未来两周亮相。
再一个,OpenAI还可能给ChatGPT语音模式增加“圣诞老人”语音,有用户发现语音模式按钮可变为雪花形状。
总体上来说,国泰君安表示,市场对OpenAI此次持续12天的活动有较高预期,或将突破AI领域上限,之前透露而未上线的功能如文生视频、视频通话,以及大模型的迭代完善都将成为关注重点。
2025年将是Agent元年
AI智能体进入“群体协作”时代
近段时间,AI Agent(AI助手)备受热捧。
前有国内智谱AI智能体AutoGLM刷屏出圈,此外微软、苹果、华为、小米等国内外头部厂商也正争先推出AI助手相关产品,OpenAI首个AI助手(Agent)产品也或将于明年1月发布。
最新消息,红杉合伙人Konstantine Buhler在近期接受了Bloomberg独家采访时强调:AI的当前热点是“智能体”,预计2025年及以后,AI智能体将从单一智能体发展到“群体协作”的模式,即多个代理组成网络,彼此协作甚至对抗,完成更复杂的任务。
此外他还指出,医疗和教育等关键领域将成为AI技术的下一个重要战场,有潜力降低成本、提高效率,从而推动社会进步。
一会儿问答大模型,一会儿01推理大模型,一会儿AI Agent,是不是经常搞得人很迷糊?它们之间到底啥关系?
最近看到一个智谱对AI的分级,分享给大家,供大家参考:
一级LLM模型,主要具有语言能力,开启了chatbot、AI搜索等应用涌现。
二级AI具有人类水准的问题求解能力,比如openAI的o1模型,可求解复杂的逻辑推理问题。
三级AI可以使用工具,系统可以执行动作,完成多数人类物理世界问题。目前的AI Agent已初步具备三级AI能力。
大家对OpenAI12天12场“新品发布会”怎么看?对200美元/月的高级会员怎么看?对AI助手怎么看,欢迎评论区讨论交流呀~
免责声明(上下滑动查看全部)
任何在本文出现的信息(包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,投资人须对任何自主决定的投资行为负责。另,本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议,亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险,过往业绩不 预示未来表现。财经早餐力求文章所载内容及观点客观公正,但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。