欢迎收看最新一期的 Hunt Good 周报!
在本期内容你会看到:
9 条新鲜 资讯
4 个有用 工具
1 个有趣 案例
3 个鲜明 观点
Hunt for News|先进头条
➕ 复旦大学公布高考数学大模型评测结果
高考试题是用来评测大模型的绝好评测集合。
本周,复旦大学 NLP 实验室 LLMEVAL 团队发布 2024 年高考数学大模型评测的结果。
在这次评测中,阿里千问和讯飞星火分别获得了 2024 年高考数学新 I 卷的第一名和第二名,以及高考数学新 II 卷的第二名和第一名。而在两份考卷的评测中,GPT-4o 均列第三名。
在新Ⅰ卷中,阿里千问和讯飞星火对 14 道数学客观题的准确率大幅领先 GPT-4o。
字节豆包、智谱清言、百川等大模型紧随其后,而百度文心一言、Kimi 等大模型准确率较低。
🔗 https://mp.weixin.qq.com/s/T6BtOrEB9sNlTj-3nftMEQ
💥 苹果发布 Apple Intelligence,Siri「换脑」接入 ChatGPT
本周,Apple Intelligence(Apple 智能)正式在 WWDC 2024 大会上面世。
Apple 智能利用先进的人工智能和机器学习,通过理解个人情境、确定通知的优先级、提供智能写作工具、创建自定义图像以及自动执行跨应用程序的操作来增强用户体验。
通俗一点说,就是你的 iPhone、iPad 和 Mac,真的带脑子了,会主动思考和理解用户了。
并且在发布会上,苹果也正式宣布与 OpenAI 达成合作。未来 ChatGPT 将被整合到 Siri 当中 ,并且被融入全系统的书写工具当中。
用户无需注册账户,即可直接免费使用这一功能。 而 ChatGPT 的付费订阅用户可以在这些操作系统中直接连接他们的账户,并享受付费功能的便捷访问。
更多信息欢迎回看 APPSO 此前文章 👇
iOS 18 正式融合 GPT-4o,苹果重新定义「AI」,你的 iPhone 喜提史诗级更新
🔗 https://mp.weixin.qq.com/s/yUkuQUlcmLvJxyE8h24zwg
👀 马斯克撤诉 OpenAI,前一天刚反对苹果接入 ChatGPT
当地时间 6 月 11 日,埃隆·马斯克于加州法院撤回了针对 OpenAI 以及两位联合创始人 Sam Altman 和 Greg Brockman 的诉讼。
马斯克律师给出的文件中没有列举他们要求撤销诉讼的理由。关于 OpenAI 驳回此案动议的听证会原定于周三举行。
在撤诉前一天,马斯克在社交平台 X 发布一系列推文和评论批评 OpenAI 及其对用户数据的处理,对于苹果和 OpenAI 的新宣布的合作关系,他也表示这是「不可接受的安全违规行为」,扬言要在自己的公司禁止苹果设备。
马斯克于今年 2 月底起诉 OpenAI 及 Sam Altman 等人,称其放弃了公司的最初使命,即开发人工智能以造福人类而不是为了利润。
🔗 https://www.bbc.com/news/articles/cw008xgn49po
🤖 英伟达开源Nemotron-4 340B 系列模型
近日,英伟达突然开源 Nemotron-4 340B 系列模型。
据英伟达介绍,开发人员可使用该系列模型生成合成数据,用于训练大型语言模型(LLM),用于医疗保健、金融、制造、零售和其他行业的商业应用。
该系列模型是由 9 万亿个 token 训练而成。Nemotron-4 340B 包括基础模型Base、指令模型 Instruct 和奖励模型 Reward。
从基准测试结果上看,Nemotron-4 340B 一举超越了 Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2,甚至媲美 GPT-4。
🔗https://blogs.nvidia.com/blog/nemotron-4-synthetic-data-generation-llm-training/
🥊 字节扣子 AI 模型广场上线
与同一个 AI 模型对话太单调,总是无法完美契合需求?
近日,字节跳动扣子平台上线了「模型广场」功能,提供了一个支持大模型匿名打 PK 的「擂台」。
具体来说,模型广场的对战模式分为「随机 Bot 对战」「指定 Bot 对战」以及「纯模型对战」三种。
和扣子聊完后,用户可以选择更好的模型并进行投票。投完票后,页面将及时揭晓两个模型的具体信息。
🔗 https://mp.weixin.qq.com/s/DUkWyfnbWXoq5OpGzqsM6Q
🧠 「小爱同学」接入豆包大模型,小米 SU7 率先搭载
士别三日,当刮目相待,你可以和小爱同学 battle 脑力了。
本周三,据字节旗下「火山引擎」公众号介绍,小米旗下人工智能助手「小爱同学」与火山引擎达成合作,双方基于豆包大模型为用户带来更智能的 AI 交互体验。
「小爱同学」作为小米公司倾力打造的智能助手,已经成功融入手机、智能家居、智能穿戴设备以及小米 SU7 等众多小米产品中,提升了用户的日常交互便捷性。
借助字节跳动豆包大模型提供的联网搜索插件能力,小爱智能助手将能够实时捕获与头条内容同源的搜索结果,为用户呈现全面且时效性强的答复。
🔗 https://mp.weixin.qq.com/s/aI1mJ65I26hs-baD2Lq49Q
💰 OpenAI 年化营收翻倍至 34 亿美元
OpenAI 在 LLM 赛道依然遥遥领先,同时也收获了相应的商业回报。
据 The Information 消息,OpenAI CEO Sam Altman 对员工表示,在过去约六个月的时间里,公司年化营收达到了 34 亿美元,相比去年年底翻了一番。
Altman 还提到,OpenAI 通过微软 Azure 提供人工智能模型接入,也有望获得约 2 亿美元的营收。作为对比,OpenAI 在 2023 年底时的年化营收还只有 16 亿美元,去年夏天时约为 10 亿美元。
此前,The Information 也报道,Altman 有意将 OpenAI 转变为一家营利性企业,其中一种考虑的方案正是目前 Anthropic 和 xAI 等竞争对手正在采用的共益公司架构。
🔗 https://www.theinformation.com/articles/openais-annualized-revenue-doubles-to-3-4-billion-since-late-2023
📷 AI 图片大赛闹乌龙,真实照片斩获两个奖项
世界是一个巨大的草台班子,AI 生成图片与真实图片的区别,不光普通人难以辨认,即使是专业摄影师,也未必总能轻易区分。
据 PetaPixel 报道,摄影师 Miles Astray 将他拍摄的真实作品提交到摄影赛事 1839 Color Photography Awards 的 AI 组别,结果意外斩获评委奖铜奖和观众票选奖。
Miles Astray 的作品:《F L A M I N G O N E》
Astray 向 PetaPixel 表达了他的初衷。他想要证明,大自然仍然可以战胜机器,并且真正的创造性工作仍然有其价值。
值得一提的是,该奖项的评审团阵容十分强大,其中包括来自纽约时报、佳士得拍卖行、Getty Images 等知名机构的专业人士。
在给 PetaPixel 的一封电子邮件中,比赛的组织者表示,尽管他们欣赏 Astray 的「强烈信息」,但考虑到其他艺术家,他的作品已经被取消资格。
🔗https://petapixel.com/2024/06/12/photographer-disqualified-from-ai-image-contest-after-winning-with-real-photo/
🛑 Copilot GPTs 宣布将停服
Copilot GPTs 上线 3 个月后就凉了。
近日,微软与官网宣布将于今年 7 月 10 日起停止其 AI 工具 Copilot GPTs 服务,同时将删除所有由用户创建的既有 Copilot GPT 及相关数据。
微软官方表示,公司将继续评估消费者 Copilot 可扩展性战略,并优先考虑核心产品体验,同时继续致力于开发者机会。
为此,微软正在将 GPT 的重点转向商业和企业场景,并停止对消费者 Copilot GPT 的支持。
值得一提的是,距离该功能的发布也仅过去 3 个月的时间,而此前 OpenAI 的 GPT Store 上线两个月后同样面临使用情况不佳的情况。
🔗 https://support.microsoft.com/en-us/topic/gpt-builder-is-being-retired-d1de6c3a-4c7a-4bcd-98ff-2f65f3d23cd1
Hunt for Tools|先进工具
📷 美图影像节发布 6 款新产品
本周,美图公司以「聊聊 AI 工作流」为主题举办第三届美图影像节,现场发布 6 款产品,覆盖多种领域:
美图云修 V2:专业级AI批量修图软件
开拍 V2:AI 制作口播视频工具
美图设计室 V3:电商 AI 设计工具
站酷设计服务:优质设计服务平台
奇觅:游戏物料 AI 制作与投放平台
MOKI:AI 短片工具
MOKI 可以辅助创作者打造动画短片、网文短剧、故事绘本和 MV,让人人都可以用 AI 轻松创作短片作品。
结合美图的应用实践,美图公司 CEO 吴欣鸿表示,目前 AI 技术领先于 AI 应用,AI 应用比想象中慢不少;好概念不等于好产品,将 AI 概念转化为优秀产品的并不多;要让 AI 帮用户创收,对于能创造价值的 AI 产品,用户是愿意付费的。
🔗 https://mp.weixin.qq.com/s/NuTXd54HP-kNkwjgm2EMHQ
💥 视频模型 Dream Machine 爆红
AI 视频生成就像「炼丹」,视频模型 Dream Machine 一夜爆红,但也没少翻车。
本周,Luma AI 宣布开放 Dream Machine 视频模型测试,可免费试用。该模型能生成「高质量」视频,120 秒可生成 120 帧,目前单个视频最长 5 秒。
生成的视频角色一致性极强,能够模拟真实的物理世界,且运镜流畅自然,完美匹配场景情感。
附上体验地址:https://lumalabs.ai/dream-machine
需要说明的是,Dream Machine 翻车的案例也不少,官网也坦诚地指出了 Dream Machine 目前尚未解决的一些局限性:
图像转换成另一个图像时,不够平滑,比如汽车的变形比较突兀
角色主体(狗)的动作移动偶尔也会稍显僵硬,
文字生成稳定性有待提高,比如 Luma 多了个「m」
图像生成不够稳定,比如北极熊一转身,凭空多出一个脑袋
🔗 https://lumalabs.ai/dream-machine
🤯 Stable Diffusion 3 Medium 正式开源
没有跳票,Stable Diffusion 3 Medium 的开源如约而至。
据 Stability AI 官方博客介绍,SD3 Medium 模型包含 20 亿个参数,能够生成更高质量、更细腻的图像。
你更喜欢哪个版本
得益于模型较小的尺寸,SD3 Medium 尤其适合在消费类 PC 和笔记本电脑以及企业级 GPU 上运行。
SD3 Medium 特点如下:
克服常见的手部和面部瑕疵,无需复杂工作流程即可提供高质量图像。
理解涉及空间关系、构图元素、动作和风格的复杂提示。
在生成文本方面取得前所未有的成果,无人工痕迹和拼写错误。
低 VRAM 占用,适用于标准消费级 GPU,也不会降低性能。
能够从小数据集吸收细微细节,使其非常适合定制。
🔗 https://mp.weixin.qq.com/s/MjN6YtlN5IyPtbvIHFx8yg
🎶 Suno 正式发布音频输入功能,任何声音一键写歌
当大众对 AI 音乐的印象还停留在文字生成,Suno 又来刷新我们的想象力了。
6 月 12 日,Suno 正式推出了一个新功能:用任何声音写歌的「音频输入」。
具体来说,在厨房的锅碗瓢盆上打出一段节奏,Suno 就可以理解,并在这个基础上创造出一首既视感超强的新歌曲。
使用这个新功能的方式很简单,录制音频,或者上传音频/视频,时长在 6 到 60 秒之间。
就像不允许特定艺术家的关键词,Suno 这次也很注重版权问题,会在上传过程中进行检测。门槛主要体验在钞能力:目前只有 Pro 或者 Premier 订阅用户可用。
🔗 https://x.com/suno\_ai\_/status/1800932487633207599
Hunt for Fun|先行
😸 你的猫正在忍受疼痛?「拍个照」就能看出来
日本初创公司 Carelogy 和日本大学(Nihon University)通过训练识别 6000 张猫咪图片,共同开发了一款名为「CatsMe!」的 App。
这款 App 可以判断猫咪何时感到疼痛。开发者表示,这款应用的准确率超过 95%,随着 AI 识别更多猫咪面孔,其准确率还有望进一步提高。
我们的统计数据显示,超过 70% 的老年猫患有关节炎或其他病症,但只有 2% 的老年猫真正去医院就诊。
日本大学教授江田和也表示,「因此与其说是最终诊断,我们更愿意将这款应用作为工具,帮助主人了解情况是否正常。」
附上网页端体验地址:https://cpd.carelogy-japan.com/analyze/en
🔗 https://www.reuters.com/lifestyle/japans-beloved-cats-get-healthcare-help-ai-2024-06-13/
Hunt for Fun | 先知
📱 苹果 CEO 称 Apple 智能很强,能让人少刷手机
苹果,AI,Cook,一起霸占了这几天的科技圈头条。
在 WWDC24 主题演讲落幕后,苹果 CEO Tim Cook 接受了一系列访谈,再一次详细介绍了苹果智能(Apple Intelligence)的诸多细节。
Cook 表示,在筛选了许多备选名之后,苹果智能似乎是最符合逻辑的。至少对他而言,这并不是在模仿 Artificial Intelligence ,他们只是简单地根据它的实际功能来命名。这样称呼它是因为它本就是这样的,就是苹果版的人工智能。
Cook 强调,苹果已经使用 AI 很长时间了。它在戴着手表的地方,它在你表的根部。像是碰撞检测、故障检测、Afib(心房颤动)这样的东西,所有这些东西归根结底都是机器学习。
Cook 认为,未来我们极有可能因为智能系统的良好运作而减少使用手机,「我们想给你一个工具,让你可以通过它,做到原本无法做到的事儿。这就是我们的动力」。
🔗 https://mp.weixin.qq.com/s/x7cxJBmEnd8WD-g2GuNamA
🚀 Sora 之父:一旦模型足够强大,能够成为独立的世界模拟器
最近,类 Sora 的视频生成模型进入了一个新的爆发期。
本周,OpenAI Sora 及 Dall·E 团队负责人 Aditya Ramesh 在智源大会上分享了一些独到的观点。
他认为,在 AI 领域,事物正在统一成一种单一范式——Transformer,目标函数也已经优化到可以固定的水平了。
在他看来,现有的数据可能已经能让人类走得很远了。通过扩大模型,规模,人类还能取得很多进展,因为可用的数据非常丰富。
一旦模型足够强大,能够成为独立的世界模拟器,很多有趣的事情将会发生。
👏 张亚勤:Transformer 架构五年内会被逐步重构
近日,在「太湖对话:人工智能+」暨清华大学 AIR 无锡创新成立仪式上,清华大学智能产业研究院院长点名了 AI 大模型的五个发展方向——括多模态智能、自主智能、边缘智能、具身智能、生物智能。
他直言道,2025 年是无人驾驶的「ChatGPT 时刻」,2030 年无人驾驶成为主流,10% 新车具备 L4 能力。
张亚勤预计,在未来 10 年内,大模型和生成式 AI 将成为主流技术和产业路线;并在 15-20 年内实现通用人工智能(AGI),并通过「新图灵测试」。
他还预测,未来 5 年内,AI 技术架构上会有大的突破。当前主流的 AI 技术框架 Transformer/Diffusion/AR,可能在未来五年内被新技术所逐步重构。
🔗 https://mp.weixin.qq.com/s/8ep4croIlpckijXI2cp8BQ
彩蛋时间
《电子游戏》
向左滑动查看更多内容
作者:@CharaspowerAI
prompt:[A Style] video game art style [deion of the scene]. High resolution, sharp focus, studio photo, intricate details, high quality, game cover
链接:https://x.com/CharaspowerAI/status/1799868719088222706