当前位置:首页|资讯|苹果|百度|华为|OpenAI|GPT-4

曝苹果国行 AI 与百度、阿里、百川接触/华为盘古大模型 5.0 发布/OpenAI CTO 称 GPT-4「智商」相当于高中生

作者:AppSo发布时间:2024-06-29

欢迎收看最新一期的 Hunt Good周报!

在本期内容你会看到:

1 个有趣 案例

8 条新鲜 资讯

6 个有用 工具

4 个鲜明 观点

Hunt for Fun|先行

🕐 不用时光机,Future You 让你与 60 岁的自己对话

和 60 岁的自己进行对话,是一种怎样的体验?

麻省理工的研发团队推出一款名为「Future You」的 AI 聊天机器人, 旨在帮助人们从未来的视角审视现在

使用方法很简单:

填写一份调查问卷,涵盖家人、朋友和重要经历等信息。

上传自己的照片,系统基于此生成 60 岁时的形象。

系统根据个人信息和未来愿景编织出详细的未来故事。

用户可以与这个虚拟的未来自我进行真实的对话。

附上体验地址:https://futureyou.life/

初步研究结果显示,使用 Future You 的参与者普遍感到焦虑减轻,对未来的规划更加清晰。

该项目的研究人员 Pat Pataranutaporn 解释说:

我们的目标是促进长期思考和行为改变,激励人们在当下做出更明智的选择,以提升他们长期的幸福感和生活成就。

🔗 https://www.techno-science.net/en/news/this-ai-based-chatbot-allows-you-to-talk-to-your-future-60-year-old-self-N25133.html

Hunt for News|先进头条

🐶 宇树机器狗又双叒叕进化了

宇树科技的机器狗再次迎来令人瞩目的进化。

在宇树科技最近公布的机器狗宣传视频中,测试难度进一步升级。画面中, 机器狗抗击打能力,抗抱摔能力一流,倒立行走、翻跟斗也不在话下。

宇树科技在社交平台 X 上表示,这些日常的强化学习驱动的机器人训练,旨在通过多次测试来不断提升机器人的性能,以更好地服务于人类。

同时,该公司也提醒,训练中包含了一些极端测试,但这些测试并不推荐用户模仿。

值得一提的是,去年宇树科技在首次亮相通用人形机器人 H1 时,也因在宣传视频中对机器人「拳打脚踢」而迅速破圈。

🔗 https://x.com/UnitreeRobotics/status/1803728664213012520

😍 阿里云推出首个 AI 程序员

6 月 21 日,在阿里云上海 AI 峰会上,阿里云推出首个「AI 程序员」。

据介绍,该 AI「程序员」具备架构师、开发工程师、测试工程师等多种岗位的技能, 最快分钟级即可完成应用开发,大幅提升研发效率。

报道称,该 AI 程序员是由通义大模型构建的多智能体组成,如任务分解、编码、测试等。

比如你想有个巴黎奥运会赛事一览表,只需几分钟,AI 程序员就能将私人订制版巴黎赛事日程应用制作出来。

🔗 https://mp.weixin.qq.com/s/Q4U\_g03IYsBQtYd7-UD0WA

🍎 曝苹果 AI 已与百度、阿里等中国企业接触

苹果国行 AI 究竟花落谁家,所有人都在等待答案。

据《华尔街日报》报道,苹果公司已经就 Apple Intelligence 服务与国内几家大模型厂商进行了磋商, 其中包括百度、阿里以及百川智能等公司。

此前,苹果软件工程主管 Craig Federigh 在接受采访时透露,也表示苹果正在努力寻找将 Apple Intelligence 引入中国市场的方法。

虽然目前没有具体的时间表,但这肯定是我们想要做的。

作为对比,三星 Galaxy S24 系列智能手机的 AI 服务在国内则由百度和美图负责,百度负责「即圈即搜」、文本摘要和其他 AI 功能,而美图则提供基于 AI 的照片编辑功能。

🔗 https://cn.wsj.com/amp/articles/%E5%9C%A8%E8%8B%B9%E6%9E%9Cai%E5%AE%8F%E5%9B%BE%E4%B8%AD-%E4%B8%AD%E5%9B%BD%E6%98%AF%E7%BC%BA%E5%A4%B1%E7%9A%84%E4%B8%80%E7%8E%AF-e4ba4472

📈 英伟达市值全球第一,但黄仁勋却更焦虑了

英伟达本周首次成为全球市值最高的上市公司,但英伟达可能比我们想象的更「平静」。

外媒 The Information 的新报道揭露了 黄仁勋从去年年底开始就为公司的未来发展感到忧虑。

比如黄仁勋对员工说,他担心微软和亚马逊这类云服务供应商的数据中心扩张不够快,就算买了芯片也没空间或足够电力来使用。

为了逐步减少对芯片销售业务的依赖,英伟达已经开始布局软件服务,甚至还开始自己做云服务 DGX Cloud。而 DGX Cloud 用的又是别家的云服务。

简单来说, 就是英伟达买了亚马逊等云服务公司的服务,然后通过 DGX Cloud 以更贵的方式卖给 AI 公司,承诺后者更好的计算表现,直接抢了自己客户的客户。

具体信息欢迎点击回看爱范儿以前的文章👉 英伟达市值全球第一,但黄仁勋却更焦虑了

🔗 https://www.theinformation.com/articles/nvidias-jensen-huang-is-on-top-of-the-world-so-why-is-he-worried

🚀 ComfyUI 作者团队成立 Comfy Org

开源,是一场无问西东的前行。

ComfyUI 的作者团队近期宣布从 Stability AI 辞职,并与其他开源开发者合作成立了 Comfy Org,推动开源 AI 技术的发展。

Comfy Org 的主要业务集中在迭代和改进 ComfyUI 生态系统上。

该组织计划通过提供咨询和企业支持服务来维持运营,同时与其他开源 AI 模型的开发者合作,共同推动 AI 技术的进步和应用扩展。

Comfy Org 强调闭源 AI 是死路一条,开源才是前进的最佳方式,并希望 ComfyUI 的成功能够激励更多公司加入开源行列。

附上 Comfy Org 传送门:https://www.comfy.org/

🔗 https://x.com/yoland\_yan/status/1803104946679849253

👏 Ilya Sutskever:我成立新公司了

本周,OpenAI 前首席科学家 Ilya Sutskever 向外界透露了他的最新动态。

不要再问 Ilya 去哪了,他宣布创立了一家名为「安全超级智能」(Safe SuperIntelligence,简称 SSI)的新公司。

SSI 公司的唯一重点,是开发安全、强大的通用人工智能(AGI)系统, Ilya 认为「这是我们这个时代最重要的技术问题」,而且 公司短期内无意销售各种 AI 产品或服务。

除了 Ilya,这家公司的联合创始人还有苹果前 AI 主管 Daniel Gross 和 OpenAI 前技术人员 Daniel Levy。

SSI 正在招聘和邀请对其使命感兴趣的专业人士,但资金和商业模式的细节尚未披露。

有人问及 Ilya 和 OpenAI CEO Sam Altman 的关系如何,他仅仅表示「很好」,也表示 Altman「大致」了解 SSI 公司。

具体信息欢迎回看 APPSO 此前文章 👇

OpenAI 前首席科学家 Ilya 宣布成立新公司,携手前苹果 AI 高管打造安全超级智能

📊 首个 AI 高考全卷评测结果发布,最高分 303,数学全不及格

本周,上海人工智能实验室和司南评测体系发布了 AI 模型参加高考「语数外」全卷能力测试的结果。

该测试选取了 6 个开源模型以及 GPT-4o 进行,采用了全国新课标 I 卷,参与评测的所有开源模型,开源时间均早于高考,成绩由具有高考评卷经验的教师人工评判。

评测结果显示,Qwen2-72B、GPT-4o 及书生·浦语 2.0 文曲星(InternLM2-20B-WQX)三个模型成为前三甲,得分率均超过 70%。

大部分模型都在语文、英语两个科目上表现良好,但是 数学科目全员不及格,InternLM2-20B-WQX 得分 75(满分 150)最高,超过 GPT-4o 的 73 分。

🔗 https://mp.weixin.qq.com/s/MzRwBEFaRjOgcxZlIXXEwQ

🤝 面壁智能与华为云达成正式合作

6 月 22 日,面壁智能与华为云达成正式合作。

在 HDC2024 ,面壁智能联合创始人、CEO 李大海先生,与华为云大数据与人工智能领域总裁尤鹏出席合作签约仪式,共同宣布: 双方将开启大模型端云协同解决方案正式合作。

面壁智能与华为云达成战略合作,意味着双方将紧密协作、共同推进大模型端云协同解决方案的研发和部署,实现端云两侧协同部署推理新范式,进一步降低大模型使用成本、提升响应速度。

🔗 https://mp.weixin.qq.com/s/FTb7Ydi8J2SrUOE02Pb\_jA

Hunt for Tools|先进工具

🆗 腾讯元宝 AI 搜索解析能力升级,支持千万字超长文处理

6 月 20 日,腾讯旗下 AI 大模型应用「腾讯元宝」进一步升级 AI 搜索及解析能力。

最新版本的腾讯元宝可支持单文档最长 1000 万字的超长文处理,能够一次性解析最多 50 个文件(单个文件大小不超过 100 MB),支持上传和解析多种文件格式。

基于解析内容,还能一键生成柱状图、折线图、饼状图等多种数据图表。

不仅如此,它还能解析 URL 网址和各类链接,并对多个链接内容进行总结与对比分析。

同时,腾讯元宝增加了对 png、jpg、jpeg、webp、bmp 和 heic 等多种图片格式的识别解析。

凭借强大的 AI 理解和生成能力, 腾讯元宝可协助用户高效完成信息检索、问题解答、决策制定、数据分析及编程调试等多项任务。

此外,腾讯混元文生图大模型(以下简称为混元 DiT 模型)前日也宣布全面开源训练代码,同时对外开源混元 DiT LoRA 小规模数据集训练方案与可控制插件 ControlNet。

🔗 https://mp.weixin.qq.com/s/Aa7OtnVTgh34ATxRDn6jkQ

💥 Claude 3.5 Sonnet 发布,GPT-4o 不香了?

蛰伏数月,Anthropic 推出最强 AI 模型 Claude 3.5 Sonnet。

据 Anthropic 官方表示,「中杯」Claude 3.5 Sonnet 比 3 Opus 更强。在技术评测报告中,Claude 3.5 Sonnet 在 GPQA 测试中的得分为 67.2%, 超过了领域内专业博士的水平。

Claude 3.5 Sonnet 的特点如下:

更通人性,更能理解细节和复杂指令,创作高质量内容

基准测试结果全方位碾压 Gemini 1.5 Pro 和 Llama-400b,大部分优于 GPT-4o

速度是 Claude 3 Opus 的两倍,成本仅为后者的五分之一

在自主编码和视觉处理等复杂任务中表现出色

除了新的模型,Anthropic 还引入了一个名为「Artifacts」的新功能,扩展了大模型和用户的交互方式,允许用户直接将 AI 应用集成到工作流中。

🔗 https://www.anthropic.com/news/claude-3-5-sonnet

👍 华为云盘古大模型 5.0 重磅发布

6 月 21 日,华为常务董事、华为云 CEO 张平安在 HDC 2024 上正式发布盘古大模型 5.0。

盘古大模型 5.0 在全系列、多模态、强思维三个方面做了全新升级。

张平安还分享了盘古大模型在 自动驾驶、工业设计、建筑设计、具身智能、媒体生产和应用、高铁、钢铁、气象等领域的丰富创新应用和落地实践,持续深入行业解难题。

例如,盘古大模型能够让机器人完成 10 步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。

同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。

🔗 https://mp.weixin.qq.com/s/ZNKqkb\_N\_QNVy1CzrSW5Sg

🥊 Runway、Luma AI 轮番炸场,视频生成卷出新高度

别等 Sora 了,Runway 发布的 Gen-3 Alpha 非但不是「期货」,而且效果惊艳网友,将 AI 视频卷出新高度。

官方分享的演示视频在质量上有了显著的提升,无论是对 AI 视频生成难以把控的夜景灯光,还是景别的流畅切换,Gen-3 Alpha 都称得上尽善尽美。甚至在文字生成上也看得出来下足了一番功夫。

更重要的是,据 @iamneubert 透露,Gen-3 Alpha 模型的生成速度非常之快。官方分享的演示视频普遍徘徊在 10 秒水平线上,而这 10 秒视频只需要 90 秒的时间就能快速生成。

巧合的是,在同一天,「竞品」Luma AI 宣布 Dream Machine 即将带来更强大的编辑功能和更直观的操作体验,这种「不期而遇」不免有点打擂台的火药味。

并且,Google 也不甘示弱,在社交平台 X 上宣布推出新的模型技术 Video-to-audio。

和 ElevenLabs 推出的 AI 音效生成功能有异曲同工之妙, Video-to-audio 支持根据视频和文本提示词生成和视频匹配的音频,甚至可以与主体角色唇形同步。

🔗 https://mp.weixin.qq.com/s/ud\_ZbZFMGu1SYSYYExPWDA

💥 快手可灵大模型新功能升级

6 月 21 日,快手可灵大模型推出了两项全新的功能: 图生视频和视频续写。

图生视频功能可以将任何静态图像转化为 5 秒的动态视频,同时支持用户通过添加提示词来控制图像的运动。

比如,上传经典的蒙娜丽莎,可灵能够让蒙娜丽莎戴上墨镜,并赋予她灵动的眼神交流。

视频续写功能则允许用户对已生成的视频进行一键续写, 每次续写生成约 5 秒的内容,通过连续多次续写,能够最长生产约 3 分钟的连贯视频。

此次升级的一大亮点是集成文本控制机制于视频续写中,这意味着用户能够通过自定义提示词,根据自己的创意继续扩展视频内容。

官方举例称,一个关于古堡的视频片段,用户既可以选择让它先「太阳落下去,天空变暗」,继而「太阳升起来,天空变亮」,亦或者「太阳落下去,天空变暗,灯光渐亮」,随后「灯光亮起,雾气氤氲」。

🔗 https://mp.weixin.qq.com/s/SUWp0WLmoL4EFMniL3Nu7Q

📹 斯坦福 AI 视频生成工具 Hedra 发布

AI 视频生成一日,人间一年。

Hedra 是一款由斯坦福初创公司发布的 AI 视频工具,它能够将音频、图像、视频整合进同一工作流,并处于免费公测阶段。

通过上传人物照片和语音,Hedra 的 AI 技术会分析语音的节奏、音调和强度,生成动态视频,其中人物的唇形、表情和姿态都能与语音内容完美同步。

Hedra 支持文本和图片生成视频,单个视频最长可达 30 秒,并且每输入 60 秒的语音和文本,可以生成长达 90 秒的视频。此外,Hedra 还计划逐步改进并扩展视频尺寸和输入形式。

不过,Hedra 的审核机制过于严格,有时会将 AI 生成的内容错误地判断为「名人」而拒绝生成。

附上体验地址:https://www.hedra.com/

🔗 https://x.com/hedra\_labs/status/1803095713112580475

Hunt for Fun | 先知

🤯 金沙江创投朱啸虎:5 年后将没有独立大模型公司存在

6 月 21 日,金沙江创投合伙人朱啸虎在「创投十年」高峰论坛上,聚焦 AI 行业的最新趋势分享了一些独到见解。

据投资作业本 Pro 报道,其部分观点如下:

这次生成式 AI 可能又是一个非常像 PC 互联网和移动互联网的,以十年为单位的长周期的机会。

如果到年底还不能推出 GPT-5,我认为 OpenAI 和英伟达的股价可能都要狂跌。

如果大模型的迭代速度放缓,应用创新的机会就会增多。我们认为从今年开始,在 AIGC 应用端可能会出现大量机会。

我可以断言,五年后可能不再有独立的大模型公司存在,要么只有 AI 应用公司或云服务公司。

今天的大模型公司很难单独存在,因为它们没有自己的商业模式。国内大厂的通义千问价格已经在许多创业型大模型公司的成本线以下。

我们的国产大模型或 Llama2 这样的开源模型可能相当于中专毕业生的水平。但经过高质量的垂直数据训练后,它们的表现可能比未经培训的清华北大毕业生还要好。

苹果公司两周前发布了Apple Intelligence,重新定义了 AI, 什么叫 AI,核心不在于技术,而在于用户体验。

🔗 https://mp.weixin.qq.com/s/p8PiMG0qGOCLFQmcVrdqbA

👀 诺奖经济学得主:AI 并没有提高工作质量,只让富人更富有

诺贝尔经济学奖得主 Christopher PISSARIDES 近日在陆家嘴论坛上就 AI 话题发表观点。

他指出尽管有声音担忧 AI 将取代人类工作,但他相信 AI 实际上在创造就业机会。他提到,尽管一些雇主试图利用AI提升效率,但 AI 更多是作为劳动力的补充而非替代者,就业数字并未因此下降。

以医疗行业为例,AI 辅助手术仍需医生和护士的监督。

PISSARIDE 还提到,不同国家对技术的需求不同。他认为中国需要的是更多的消费,而不是 AI 来提高生产力。

另外,他建议,应关注 AI 如何提升生活和工作品质,让 AI 承担如搬运重物等枯燥的体力劳动。 但目前 AI 似乎更多地是在帮助富人变得更富,而非普遍助力工作。

😇 Hugging Face CEO:越来越多 AI 初创公司创始人希望出售自家公司

越来越多的 AI 初创公司开始寻求脱离牌桌的机会。

Hugging Face CEO Clément Delangue 近日在接受彭博社的采访时透露,随着 AI 市场的整合趋势日益明显,越来越多的 AI 初创公司创始人正寻求出售其公司。

Delangue 表示,他每周都会收到大约 10 家 AI 初创公司表达被收购兴趣的消息。他指出, 「尤其是今年,这种增长非常明显。」

不过,Hugging Face 也并非只是被动等待其他公司来接洽。此前,Hugging Face 主动与 AI 初创公司 Argilla 接洽合作,最终在本月宣布以 1000 万美元的价格收购该公司。

🔗 https://www.bloomberg.com/news/articles/2024-06-13/more-ai-founders-looking-to-sell-startups-hugging-face-ceo-says

🧐 OpenAI CTO:「博士级智能」未来几年后出现

OpenAI CTO Mira Murati 近期因一系列言论激起了舆论的波澜。

在母校达特茅斯工程学院的访谈中,Murati 提到 ChatGPT 这些 AI 系统虽然整体尚未达到人类水平,但在特定任务中已经媲美人类。

像 GPT-3 这样的系统,大概可以说智能水平相当于一个幼儿。而像 GPT-4 这样的系统更像是高中生的智能水平。

在未来几年,我们期望看到针对特定任务的博士级别的智能。

对于 AI 安全问题,她表示,智能和安全性实际上是相辅相成的。引导一个更聪明的系统更容易,只需告诉它,「好的,不要做这些事情」即可。

今天凌晨,Mira Murati 也再发长文,举例称 AI 将胜任某些任务。

就像电子表格为会计师和簿记员带来了变革,人工智能工具也能承担起编写在线广告或制作标准图像和模板等工作。

然而,我们应区分短暂的创意任务和那些能为社会带来长远意义和价值的任务。

🔗 https://x.com/miramurati/status/1804567253578662264

彩蛋时间

🛑 《遁入黑暗,成为无》

作者:@ciguleva

工具:Midjourney

链接:https://x.com/ciguleva/status/1803304837536190670


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1