欢迎收看最新一期的 Hunt Good周报!
在本期内容你会看到:
8 条新鲜 资讯
5 个有用 工具
1 个有趣案例
4 个鲜明 观点
Hunt for News|先进头条
🎬 Sora 首部商业片亮相戛纳
Sora「轰炸」了影视圈近半年,最近又有了新动静。
近日,玩具反斗城发布了全球首部使用视频生成模型 Sora 制作的宣传片《玩具反斗城的起源》。
这部影片由四次艾美奖获奖制片人 Kim Miller Olko 担任执行制片人,导演 Nik Kleverov 执导, 并在戛纳上高调展出。
影片主要讲述了吉祥物长颈鹿杰弗瑞的起源故事以及创始人 Charles Lazarus 是如何构想出玩具反斗城这个充满童年梦想的品牌故事。
网友也对该影片的视频质量提出质疑,例如在模拟手部细节和保持人物形象一致性方面,仍有待进一步的优化和完善。
🔗 https://x.com/mjassal/status/1805706020867784723
🎶 唱片三巨头起诉两家明星 AI 音乐公司
「你的 AI 侵犯了我的版权」,这是生成式 AI 进入大众视野后聊得最多的话题。
本周,全球三大唱片公司环球音乐、索尼音乐、华纳音乐起诉 AI 音乐生成初创公司 Udio 和 Suno,指控其使用未经授权的音乐作品训练 AI,构成了大规模的版权侵犯。
这些唱片公司向法院请求,对于被控抄袭的每一首歌曲,应给予高达 15 万 美元的赔偿。据指控, Suno 涉嫌抄袭了 662 首曲目,而 Udio 则涉嫌抄袭了 1670 首曲目。
美国唱片业协会的主席兼 CEO Mitch Glazier 表示,像 Suno 和 Udio 这样的未经授权的 AI 音乐生成服务,以「公平使用」为名复制艺术家的毕生作品,阻碍了人类真正创新 AI 的承诺。
Udio 在社交媒体平台 X 上回应称,公司已经部署并持续优化了行业领先的过滤机制,以确保 AI 模型不会复制任何受版权保护的作品或模仿任何艺术家的声音。
🔗 https://www.theguardian.com/music/article/2024/jun/25/record-labels-sue-ai-song-generator-apps-copyright-infringement-lawsuit
💥 史上最快 AI 芯片 Sohu 登场
英伟达是当前 AI 领域唯一的军火商,但总有黑马异军突起。
在宣布融资 1.2 亿美元后,AI 芯片初创公司 Etched 最近发布了目前最快的 AI 芯片——Sohu。它号称可以在毫秒级别的时间里处理数千个单词。每秒能处理超过 50 万个 tokens,运行 Llama 70B 模型。
这就相当于可以在两秒内写完《圣经》,或者一年写 15 万亿个 tokens。
据 Etched 官网介绍,Sohu 是首个专为 Transformer 模型设计的专用芯片(ASIC),相较于英伟达 H100,Sohu 的推理速度提升了 8 至 10 倍。
一个搭载八片 Sohu 芯片的服务器,可以取代整整 160 个英伟达 H100 GPU。
创始人 Gavin Uberti 和 Chris Zhu(华裔)也都拿着天才的剧本。在度过了一段本科生活后,他们一起从哈佛大学辍学并创办 Etched。
🔗 https://mp.weixin.qq.com/s/JQat9FlWZGydn8R1hLmPcA
🔍 钉钉发布全新 AI 搜索,宣布对所有大模型开放
6 月 26 日,Make 2024 钉钉生态大会在北京举办,会上钉钉宣布了 7.6 版本,全新 AI 搜索产品开启邀请测试。
据介绍,这个 AI 搜索产品基于 AI 大模型,智能化整合钉钉上的工作信息,可以帮助用户整理离散信息为结构化知识网络。
钉钉还升级了 AI 助理的思考、感知、行动系统,上线多 Agent 协同、拟人操作等能力,并支持用户按需切换底层大模型。
大会上,钉钉宣布对所有大模型厂商开放。除了通义大模型外,MiniMax、月之暗面、智谱 AI、猎户星空、零一万物、百川智能六家大模型厂商已经与钉钉达成合作。
钉钉总裁叶军表示, 随着行业从模型创新走向应用创新,探索大模型的应用场景是钉钉的责任所在。
大会上钉钉还宣布了一则数据:钉钉上创建的 AI 助理总数约 50万个。
🔗 https://mp.weixin.qq.com/s/6vrmE9ZevYKRg6b7W\_uApw
👀 Rabbit R1 API 被曝漏洞,可暴露用户信息
在尝鲜 AI 硬件之前,我们还得警惕安全漏洞问题。
AI 当红炸子鸡 Rabbit R1 近期被一个名为 Rabbitude 的社区研究团队曝出 API 存在多个安全漏洞。
具体来说,Rabbit R1 设备的源代码中直接存储了多个重要的 API 密钥,这些密钥被硬编码在代码中,而不是通过环境变量或其他更安全的方式管理。
由于这些 API 密钥的存在,任何能够访问这些密钥的人都可以获取 R1 设备的所有响应和用户数据。这意味着第三方可以访问通过 R1 发送的文本提示,并且能够读取设备发出的所有响应。
例如,第三方可以利用这些 API 密钥访问所有电子邮件发送记录,进一步侵犯用户隐私。对此,R1 官方回应称,截至 6 月 26 日,尚未发现用户的关键系统或客户数据的安全受到任何损害。
🔗 https://www.theverge.com/2024/6/26/24186614/rabbit-r1-security-flaw-api-key-codebase
👏 Stability AI 续命成功,获顶级投资机构重大投资
开源 AI 大模型是一场烧钱的游戏,而 Stability AI 或许还能再撑一阵。
在经历了一段财务困境后,Stability AI 本周宣布获得了来自顶级投资机构的重大投资,包括 Greycroft、Coatue Management、Sound Ventures 等。
投资者与 Stability AI 的云提供商和其他供应商达成协议,免除了公司约 1 亿美元的债务,并且在未来三年内免除 3 亿美元的未来债务。
Facebook 前总裁 Sean Parker 将担任执行主席。视觉特效公司 Weta FX 前负责人 Prem Akkaraju 被任命为新 CEO,曾领导包括《阿凡达》和《复仇者联盟:终局之战》等多部知名电影的视觉效果制作。
有观点认为,Prem 的丰富经验和专业背景将能帮助 Stability AI 在技术和市场方面取得突破。
🔗 https://stability.ai/news/stability-ai-secures-significant-new-investment
🔭 OpenAI 前对齐团队「遗作」,用 GPT-4 自我纠错
OpenAI 本周官宣了一个名为 CriticGPT 的模型,专门用于识别 GPT-4 生成的代码中的错误。
CriticGPT 基于 GPT-4 构建,并通过人类反馈中强化学习(RLHF)技术来增强其性能。该模型旨在帮助人类更准确地评估和审查 ChatGPT 生成的代码,从而提高代码质量。
实验数据显示,CriticGPT 在检测代码错误的表现上比人类高出 60%,并且在很多情况下比专业外包人员更能发现大模型输出的问题。
值得注意的是,该模型是超级对齐团队 scalable oversight 团队共同完成,前超级对齐团队负责人之一 Jan Leike 也出现在作者署名中。
Jan Leike 在社交平台 X 兴奋地表示:
非常激动,这个项目现在终于发布了(这源于我在 OpenAI 工作期间的努力):我们训练了一个大型语言模型来审查代码并找出错误,这帮助人类在实际的生产任务中发现了他们本可能忽略的问题。这为开发可扩展的监督机制提供了极大的希望!
🔗 https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/
🤖 HumanPlus 人形机器人再进化
斯坦福大学研发的 6 英尺高人形机器人 HumanPlus 最近又整起了新活。
视频中的 HumanPlus 人形机器人 能够自主穿上耐克鞋、系鞋带、站立并行走。
据介绍,这款机器人采用了两个 Transformer 模型和双 RGB 摄像头,融合了两种通用机器人的端到端方法,即在现实世界中模仿人类行为,以及在模拟环境中进行大规模强化学习(RL)。
并且,HumanPlus 人形机器人通过模仿人类,还学会了折叠运动衫,从仓库货架上卸载物品、下蹲、跳跃和站立,甚至与另一台机器人打招呼等。
🔗 https://x.com/zipengfu/status/1805288544434635026
Hunt for Tools|先进工具
🥊 Google 开源模型 Gemma 2 发布,性能力压同级
本周,Google 向全球研究人员和开发人员推出了 Gemma 2 开源 AI 模型。
Gemma 2 模型分为两种规模:90 亿参数和 270 亿参数,可以为不同的使用场景提供灵活的选择。 它的性能在同规模模型中处于领先地位,甚至在某些情况下能够媲美更大规模的主流模型。
从基准测试结果来看,Gemma 2 9B 在同规模模型中处于领先地位,大幅度超过 Llama 3 8B,Gemma 2 27B 实力可媲美 Llama 7 70B,全面碾压 Grok-1。
Gemma 2 模型在效率和成本方面进行了优化,可以在单个 Google 云 TPU 主机、英伟达 A100 80GB Tensor Core GPU 或 H100 Tensor Core GPU 上以全精度高效运行推理,从而让部署更加经济实惠。
🔗 https://blog.google/technology/developers/google-gemma-2/
🧑🎨 Figma 开卷 AI,喜迎重磅更新
AI 时代下的设计工具应该是什么样?设计界春晚 Figma Config 大会给出了一些答案。
Figma 发布了全新的「UI3」,带来了更干净、简洁的界面。新的 UI3 采用了圆角设计,更新了超过 200 个图标。
原来的工具栏现在进化为「工具条」,位置也被移到了界面底部。另外,现在侧边栏的大小可以根据需求进行调整,还可以随时隐藏。
Figma 表示,这是其自内测以来的第三次「重大重新设计」。
他们想「减少 Figma UI 在画布上的存在感,让你更专注于工作」,并希望可以让新用户更轻松地上手。
具体变化欢迎回看 APPSO 此前文章 👉 Figma 带来重磅更新,AI 时代下的设计工具应该是什么样?
🔗 https://mp.weixin.qq.com/s/LyLjRwYIKRfN7ptG7uK2Ow
💻 Mac 版 ChatGPT 向所有用户免费开放
本周,OpenAI 宣布向所有人推出 Mac 版 ChatGPT。
好消息是,人人均可下载体验;坏消息是,它对 Mac 上的芯片和系统有些挑剔,至少 intel 芯片只能眼巴巴地看着。
我们也第一时间下载体验了一番,并且找到了一些彩蛋功能。
附上下载地址:https://openai.com/chatgpt/mac/
更多信息欢迎回看 APPSO 此前文章: 体验完 Mac 版 ChatGPT,我发现了这些新功能
🔗 https://mp.weixin.qq.com/s/SofW67JnDDXQxUxkVK9KOA
🤯 阿里 Qwen-2 成全球开源大模型排行榜第一,中国处于领导地位
6 月 27 日凌晨,全球最大 AI 开源平台 Hugging Face 联合创始人兼首席执行官 Clem 称,为了更新开源大模型排行榜,已使用 300 块 H100 对目前全球 100 多个主流开源大模型进行全新评估。
例如,Qwen2、Llama-3、mixtral、Phi-3 等,都在 BBH、MUSR、MMLU-PRO、GPQA 等基准测试集上进行了新一轮评估。
结果显示,阿里最新开源的 Qwen2-72B 指令微调版本,成为开源模型排行榜第一名。并且, Clem 认为中国在全球开源大模型领域处于领导地位。
🔗 https://x.com/ClementDelangue/status/1805989925080219927
👏 史上最快语音机器人诞生
和语音机器人聊天,你总是希望它的语速和真人一样自然。
Daily 的联合创始人 Kwindla 与 Cerebrium 合作,打造了一个可以实现 500 毫秒响应的语音 AI 机器人。
据介绍,延迟的降低主要归功于以下技术:
语音转文本、LLM 推理和文本转语音功能集成在同一系统内。
WebRTC 和边缘网络技术用于音频传输,降低延迟。
调整计时配置,优化系统响应速度,实现性能与资源的平衡。
附上体验地址:https://fastvoiceagent.cerebrium.ai
🔗 https://www.daily.co/blog/the-worlds-fastest-voice-bot/
Hunt for Fun|先行
Glif,五分钟打造你的创意梗图
越来越多的 AI 小众产品,正在通过社交媒体平台的病毒式传播而迅速破圈。
Glif 是一个低代码平台,支持用户创建一些 glifs。这些 glifs 能够将简单的输入,如文本或图像, 转化为一些具有创造性和幽默感的 meme(梗图)。
一起来看看网友又整了哪些活 👇
向左滑动查看更多内容
具体原理很简单,Glif 平台的核心在于其 Agent 构建功能,以最火的 WOJAK meme 生成器为例,在生成梗图的过程中,一般会遵循以下这些流程:
1.
通过 QA 问题获取用户输入。
2.
使用文本 LLM 将输入转化为 meme 的 JSON 体,包含标题、反转的句子和图片。
3.
结构化解析 JSON 体。
4.
生成肖像画。
5.
利用 Canvas 将所有元素拼装成最终的 meme 图片。
X 网友 @FinanceYF5 也分享了中文版的使用地址:
https://glif.app/@c6a2f3a781/glifs/cly0v6cuw0001r5ajy9ucrc5v/edit
🔗 https://x.com/FinanceYF5/status/1805762969466552727
Hunt for Fun | 先知
⚡️ 比尔・盖茨:不要「过分担心」AI 用电问题
「吞」水、「吃」电,耗芯又耗人,AI 也有浪费资源的 B 面。
然而,比尔·盖茨最近却在伦敦的一场演讲中,呼吁环保人士和政府「不要过度关注」运行生成式 AI 所产生的大量电力需求问题。
他表示,科技公司在寻求新的能源来源时,会愿意为清洁能源支付「绿色溢价」,将有助于推动清洁能源的开发和部署。
不过,尽管他认为科技公司正在推广绿色能源,但转型所需的绿色能源也不会像人类所需要的那么快出现。因此, 到 2050 年实现净零排放的全球目标很可能无法实现,「再过 10 年或 15 年可能更现实」。
🔗 https://www.ft.com/content/68495f0d-4d35-4270-a33d-02e9e537460f
❌ 智源研究院创始人:AI 系统永远不应该欺骗人类
近日,在接受英国《金融时报》采访时,北京智源研究院创始人张宏江深入讨论了 AI 安全以及中国 AI 发展的竞争优势等热议话题。
张宏江强调,AI 系统不应该具有欺骗人类的能力。
另一个显而易见的原则是,AI 系统不应该具备生产大规模杀伤性武器和化学武器的能力。此外,人工智能系统的说服力也不应该比人类更强。
在讨论中国在人工智能领域的竞争力时,他表示,人才、应用场景、创业精神是中国的优势,但其并不认为政府的政策一定是优势。
关于开源与闭源软件的辩论,张宏江强调不能简单地断言哪一种模式具有绝对的优势。
他预计仍需要较长时间来观察哪一种模式能够胜出。不过,他更倾向于认为这两种模式将会在 AI 领域长期共存。
🔗 https://www.ft.com/content/bec98c98-53aa-4c17-9adf-0c3729087556
📖 微软 AI 负责人:未来知识生产成本将降到边际成本为零
在近日举行的阿斯彭思想节上,微软 AI 负责人穆斯塔法·苏莱曼在谈及 AI 是否实际上窃取世界知识产权的问题时,给出了否定的回答。
苏莱曼表示,对于许多开放网络上的内容,默认的社会契约是允许这种使用的。 自 90 年代以来,网络内容的社会契约是基于「公平使用」原则,这意味着任何人都可以复制、重建或再生公开可用的内容。
不过,苏莱曼补充说,某些网页内容可能并不一定可以免费获取,特别是某些出版商已经要求 AI 公司不要爬取他们的网站。
此外,在苏莱曼看来,AI 技术的强大处理和生成数据能力,可能会颠覆现有的知识生产和分配方式,从而导致信息经济学发生根本性的变化。「因为我们将把知识的生产成本降低到边际成本为零。」
🔗 https://siliconangle.com/2024/06/28/microsoft-ai-ceo-mustafa-suleyman-describes-content-open-web-freeware/
💰 Sam Altman:AGI 或在十年内实现全球 GDP 翻倍
近日,OpenAI CEO Sam Altman 和 Airbnb CEO Brian Chesky 与 NBC 主持人 Lester Holt 共同探讨了 AI 安全、对 GDP 的潜在影响的讨论。
面对 AI 可能带来的负面影响,Altman 强调了行业内采取强硬立场的重要性。他提到,除了呼吁监管以防止滥用外,OpenAI 在产品和服务中也树立了高标准,以身作则。
「技术不是中立的,」Altman 说,「我们希望正确地使用这些工具,为创造我们共同生活的未来做出贡献。」
关于如何将正面价值观灌输给计算机,Altman 表示,OpenAI 几个月前发布了一套规范,明确了他们希望 AI 模型遵循的价值观。「这样,人们至少可以判断,当模型做出他们不喜欢的事情时,这是一个错误还是故意的,」他解释说。
Altman 指出,尽管没有完美的历史类比,但通过比较曼哈顿计划、阿波罗计划、iPhone、iMac、互联网和工业革命,我们可以从历史中学习,同时认识到 AI 的独特性。
我们可能是错的,也可能是对的,但告诉社会我们认为这项技术的重要性是很重要的。
在讨论 AI 对全球 GDP 的潜在影响时,Altman 预测,AGI 可能会使全球 GDP 翻倍,这与历史上的技术革命一致。
他补充说,如果世界 GDP 能以每年 7% 的速度增长,这听起来可能很快,但随着技术变革的推动,这并不遥远。「这大约需要十年时间来翻倍,」Altman 指出,「所以,这项技术带来的巨大潜力值得我们认真对待。」
🔗 https://www.nbcnews.com/tech/tech-news/openai-ceo-sam-altman-says-ai-tools-will-shape-future-rcna159044
彩蛋时间
🍉 《西瓜人》
作者:@umesh_ai
Prompt::Enhanced side angle photorealistic 3D shape view of a [SUBJECT] composed entirely of the red pulp of juicy watermelon, appearing natural and lifelike. Focus intensively on the pulp juicy texture, ensuring it vividly represents the juicy, glistening nature of pulp. The [SUBJECT] form should be exceptionally detailed, with clear, realistic watermelon pulp fibers and 5 seeds that are accurately portrayed in size and distribution. The contrast with the dark background should be optimized
链接:https://x.com/umesh\_ai/status/1805556346483622152