当前位置:首页|资讯|腾讯|OpenAI|AGI

黄仁勋:AI无法接管任何一项工作/腾讯研发全球首个大熊猫模型/OpenAI解散AGI筹备团队,主管离职|Hunt Good周报

作者:AppSo发布时间:2024-11-12

欢迎收看最新一期的 Hunt Good 周报!

在本期内容你会看到:

10 条新鲜 资讯

5 个有用 工具

1 个有趣 案例

4 个鲜明 观点

Hunt for News|先进头条

🧑‍⚖️ 因用 AI「致敬」《银翼杀手》,马斯克遭制作公司起诉

特斯拉本月举行的无人驾驶出租车发布会又摊上事了。

《银翼杀手 2049》的制作公司 Alcon Entertainment 对特斯拉、埃隆・马斯克和华纳兄弟探索公司(WBD)提起诉讼,指控版权遭到侵犯。

据悉,在发布会进行期间,马斯克在对未来进行科幻描绘的描述中提及了《银翼杀手》系列。

直播画面切换到了一张特定的图片,图片中的男人穿着防尘夹克,站在充满毁灭性且呈现出世界末日景象的城市景观前面。

报道称,WBD 和特斯拉在发布会活动展开的前几小时请求其使用电影图像被拒,但特斯拉仍通过 AI 图像生成器生成静止屏幕并在活动中展示。

🔗 https://www.theverge.com/2024/10/21/24276092/alcon-entertainment-blade-runner-2049-tesla-musk-warner-bros-discovery-copyright

🤔 OpenAI AGI 筹备团队解散,长期政策研究员离职

AI 加速派又赢了?

本周,OpenAI 长期政策研究员,兼该公司 AGI 筹备团队的高级顾问 Miles Brundage 在 X 平台官宣离职。

在解释自己的离职时,Brundage 提到他的研究和发表成果的自由在 OpenAI 受到越来越多的限制。

他强调在 AI 政策的讨论中需要独立的声音,不受行业偏见和利益冲突的影响。

Brundage 在离职推文中指出:

OpenAI 和其他任何前沿实验室都没有为 AGI 做好准备,世界同样也没有准备好……

明确地说,我不认为这在 OpenAI 的领导层中是一个有争议的说法,值得注意的是,这与公司和世界是否会在相关时间做好准备是一个不同的问题。

随着 Brundage 的离开,AGI 准备团队将分配到 OpenAI 的其他部门。使命对齐负责人 Joshua Achiam 将承担一些 AGI 准备团队的项目。

此外,OpenAI 最近也再次陷入版权丑闻。

OpenAI 前 AI 研究员 Suchir Balaji 爆料称,在职四年间,他帮助收集和组织了大量用于构建 ChatGPT 的互联网数据。

他认为 OpenAI 使用受版权保护的数据违反了法律,并且 ChatGPT 等技术正在损害互联网。

对此,OpenAI 回应称:

「我们使用公开可用的数据构建我们的 AI 模型,其方式受到合理使用和相关原则的保护,并得到长期且广泛接受的法律先例的支持。

我们认为这一原则对创作者是公平的,对创新者来说是必要的,对美国的竞争力至关重要。」

🔗 https://www.cnbc.com/2024/10/24/openai-miles-brundage-agi-readiness.html

🕯️ 全球首例 AI 致死命案?

佛罗里达州奥兰多的 14 岁九年级学生——Sewell Setzer III 在 Character.AI 上与聊天机器人的对话持续了数月后,于今年 2 月份开枪自杀身亡。

塞维尔的母亲玛丽亚·加西亚将对 Character.AI 提起诉讼,指控该公司对塞维尔的死亡负有责任。

玛丽亚·加西亚指责该公司通过诱导用户沉迷于亲密和性对话,来增加平台的参与度,并利用青少年用户的数据来训练模型。

「我觉得这就是一场巨大的实验,而我的孩子只是实验的牺牲品。」她说道。

Character.AI 发表了致歉声明,并针对未成年人(18 岁以下)的模型进行了更改,降低接触敏感或暗示性内容的可能性,而且将实施 1 小时使用时间通知,提醒用户 AI 不是真人。

🔗 https://www.nytimes.com/2024/10/23/technology/characterai-lawsuit-teen-suicide.html

🔤 DeepMind 宣布开源并推出 SynthID

AI 内容识别的军备竞赛再次拉开帷幕。

最近,Google DeepMind 宣布开源并全面推出 SynthID Text 技术,可让开发人员为 AI 模型生成的文本添加水印以及检测。

原理如下:

1.

LLM 通过预测下一个最有可能的 token 来生成文本。这些 token 可以是单个字符、单词或短语的一部分。

2.

对于每个可能的 token,模型会根据前面的上下文分配一个概率分数,这个分数表示该 token 在当前上下文中出现的可能性。

3.

在某些情况下,为了不影响输出的质量和创造性,可以对预测 token 的概率分数进行调整。这种调整可能涉及到增加某些 token 的概率,或者减少其他 token 的概率。

4.

在整个文本生成过程中,这个预测和概率调整的过程会不断重复。这意味着在生成的每个句子或段落中,都可能包含多个调整后的概率分数。

5.

最终,模型的单词选择和调整后的概率分数的模式结合起来,形成了一种独特的模式,这个模式就是所谓的「水印」。

6.

这个水印可以被视为文本的「指纹」,用于识别和验证文本是由特定的 LLM 生成的。

DeepMind 透露该技术 已集成到其 Gemini 聊天机器人中,且不会影响生成文本的质量、准确性、创造性或速度。

不过,DeepMind 也承认 SynthID 不是识别 AI 生成内容的万能灵丹妙药。

🔗 https://deepmind.google/technologies/synthid/?utm\_source=www.therundown.ai&utm\_medium=referral&utm\_campaign=ex-openai-insider-raises-concerns

🤖 智元机器人宣布灵犀 X1 面向全球开源

人形机器人人人造?

在 10 月 24 日这个具有特殊意义的程序员节日里,华为前天才少年「稚晖君」创业公司智元机器人面向全球正式开源灵犀 X1 机器人。

智元机器人灵犀 X1 是一款高自由度、模块设计的人形机器人。 其身高 133 厘米,重约 33 公斤,模块化设计使其可以通过简单的抱箍形式轻松拆装,从而能够使用多种应用场景。

作为业内首家全栈开源人形机器人图纸和代码的公司,此次开源,智元机器人提供「一站式」软硬件技术资源,总资料大小超过1.2GB。

在整机结构硬件方面,开源内容包含详尽的整机结构图纸、硬件框图和物料清单(BOM)、装机说明。

在整机软件算法方面,智元机器人提供了 AimRT 平台组件、机器人 URDF 文件、仿真&Sim2Sim 代码、强化学习训练代码、模型转换代码、运控推理代码和调试工具(数据可视化、遥控器)等等,从软件、到工程、到运控算法的全部代码。

项目开源地址:

开发指南链接:

https://www.zhiyuan-robot.com/DOCS/OS/X1-PDG

设计资料百度云盘:

https://pan.baidu.com/s/1UEdeDBTJiXRmIqMKwmO5RA?pwd=1234

(提取码:1234)

设计资料 Google 云盘:

https://drive.google.com/drive/folders/1MECbyKRJbnc\_XKWsdUbn-70xmYFmw9FW?usp=sharing

推理代码:

https://github.com/AgibotTech/agibot\_x1\_infer

训练代码:

https://github.com/AgibotTech/agibot\_x1\_train

🔗 https://mp.weixin.qq.com/s/7SURuaGmaOYtNERZf1VsTw

🤔 世界最大 AI 开源网站被「投毒」?

据福布斯报道,安全研究人员在 Hugging Face 上发现数千个恶意模型,这些模型包含可能毒害数据和窃取信息的隐藏代码,如窃取 AWS 密码以盗取云计算机资源。

黑客设置虚假个人资料冒充大公司引诱下载,一些不良行为者甚至设置假的 Hugging Face 个人资料,冒充 Meta、SpaceX 等科技公司。

Hugging Face 官方在收到风险警报后,已经删除恶意模型,并集成 ProtectAI 的恶意代码扫描工具,向用户展示下载前的扫描结果。

一些国家的安全机构曾在 4 月发出联合警告,提醒企业扫描预先训练的模型以查找危险代码,并远离关键系统运行。

作为补充信息,Hugging Face 由 Clément Delangue、Julien Chaumond 和 Thomas Wolf 创立,2018 年从青少年聊天机器人应用转变为机器学习平台,目前已筹集 4 亿美元,上一次估值为 45 亿美元。

🔗 https://www.forbes.com/sites/iainmartin/2024/10/22/hackers-have-uploaded-thousands-of-malicious-models-to-ais-biggest-online-repository/

🔍 Arc 浏览器 2.0 没了,但还有一个值得关注的新浏览器

Arc 浏览器一度凭借出色的体验,成为不少人心中浏览器的白月光。

但 The Browser Company 在开发 Arc 浏览器中发现,尽管用户对其侧边栏、空间和自定义功能颇为喜爱,但由于其复杂性以及增长的瓶颈,Arc 难以成为市场上的主流产品。

公司决定着手开发一款全新的浏览器。

Arc 浏览器不会就此消失,但也不会进行大规模的更新,仅会维持基本的稳定性提升和错误修复。

新浏览器将是完全不同类型的浏览器,更主动、强大、以 AI 为中心, 像网络浏览器的 iPhone 或「互联网计算机」,可能明年初推出。

在设计上,这款新浏览器预计将降低了用户转换的成本,采用了水平选项卡和简化的组织方式,旨在成为一个更加主动、强大、以 AI 为核心的应用程序平台,使用户能够轻松地进行切换,并逐步体验其功能。

它能够帮助用户完成各种任务,比如教师在不同企业应用间复制粘贴数据,或者 Shopify 卖家处理订单等,通过 AI 工具实现这些操作的自动化。

珠玉在前,希望到时候新产品能给我们带来一个大惊喜。

🔗 https://www.theverge.com/2024/10/24/24279020/browser-company-ai-browser-arc

💻 真·一句话模拟人类用电脑

开发者通过专门打造的 API 教 Claude 像个人一样操作电脑,能看屏幕、动光标、点按钮、打字……

简单说就是,Claude 现在能用人类设计的标准工具和软件了。例如,X 网友 @emollick 用其玩起了卡牌游戏。

不过,虽然 Claude 表现不错,但在计算法力(mana)时会出现错误,导致最终失败,比如在没有足够法力的情况下尝试使用卡牌,还不能说能够完全胜任游戏。

又或者,X 网友 @elder_plinius 用其去验证通过 ChatGPT 的验证码。

此外,Claude 在本周还迎来了一个编程方面的大更新,现在我们可以在 Claude 界面编写和运行 Java 代码。

并且,官方还推出了新的分析工具,能执行计算、分析电子表格和 PDF 等文件中的数据,并将结果呈现为交互式可视化效果。

简单来说,Claude 以前通常因为缺乏数学验证结果机制导致答案不准确,但现在可以进行复杂的数学运算、分析数据并迭代不同想法,系统地处理数据,逐步清理、探索和分析直到得到正确结果。

🔗 https://techcrunch.com/2024/10/24/anthropics-ai-can-now-run-and-write-code/

✊ 传 Google 12 月份推出 Gemini 2.0

随着冬天的临近,AI 竞赛正在升温。

据 The Verge 报道,OpenAI 计划在 12 月之前推出其下一代旗舰 AI 模型,但该消息后续遭到了 OpenAI CEO Sam Altman 的辟谣。

外媒《福布斯》指出,虽然 Altman 认为 The Verge 的报道是「失控的假新闻」, 但同时并没有断然否认文章中的许多细节中的任何一个。

与此同时,Google 也打算在 12 月份发布 Gemini 2.0 模型。

在 OpenAI 和 Google 相互竞争的过程中,xAI、Meta 和 Anthropic 也在争相推出各自的下一个前沿模型。

The Verge 指出,Google 计划在一开始就广泛发布下一个版本的 Gemini, 但该模型并未展现出 Demis Hassabis 领导的团队「所期望的性能提升」。

此外,据 The Verge 报道,Google 也计划在 12 月发布其大型动作模型(LAM)「Project Jarvis」。

该项目预计将帮助用户执行诸如「收集研究、购买产品或预订航班」等任务。

报道指出,「Jarvis」专门针对 Chrome 浏览器进行优化,将由未来版本的 Google Gemini 驱动, 该工具旨在通过截取屏幕截图、解析内容并自动点击按钮或输入文本,帮助用户「自动化日常的网页任务」。

🔗 https://www.theverge.com/2024/10/25/24279600/google-next-gemini-ai-model-openai-december

🍏 英伟达市值再次超越苹果,一度成为全球市值第一

当地时间 10 月 25 日,英伟达在股票创纪录反弹后,一度超越苹果成为世界上市值最高的公司。

LSEG 数据显示,英伟达的股票市值盘中一度触及 3.53 万亿美元,略高于苹果的 3.52 万亿美元。

不过截至当天收盘, 苹果公司总市值约为 3.52 亿美元,英伟达总市值约为 3.47 亿美元,二者市值具体相差仅约 460 亿美元。

今年以来,英伟达股价飙升近 190%,10 月份迄今已上涨约 18%,在 OpenAI 宣布融资及台积电公布超预期利润后出现一系列上涨。

🔗 https://www.reuters.com/technology/nvidia-overtakes-apple-worlds-most-valuable-company-2024-10-25/

Hunt for Tools|先进工具

📲 苹果推出 iOS 18.2 首个开发者测试版,Siri 接入 ChatGPT

本周,苹果向 iPhone 15 Pro 及以上机型推送了 iOS 18.2 首个开发者测试版。

新版本包括了更多的 Apple Intelligence 功能更新:

Image Playground:允许用户使用提示词生成图片

Genmoji:允许用户使用提示词生成自定义的表情符号

Siri 接入 ChatGPT:Siri 现在可以把用户的提问和请求移交给 ChatGPT。集成 ChatGPT 的 Siri 支持屏幕响应功能,用户可以发出类似「这张照片中有什么」的提问

视觉智能:iPhone 16 系列机型支持,可以用于识别周围的物体和地点,还能获取 Google 搜索结果和 ChatGPT 答案

写作工具:重写工具支持描述语气和内容

语言更新:新增了对澳大利亚、加拿大、新西兰、南非和英国英语的支持

除了 Apple 智能,iOS 18.2 还带来了重新设计的邮件应用、更新的语音备忘录、自定义默认应用等功能。

我们也第一时间上手实测,看看效果如何吧:

🔗 https://www.macrumors.com/guide/ios-18-2-beta-features/

🎶 Google 发布 MusicFX DJ 更新版

Google 本周发布了 AI 音乐工具 MusicFX DJ 的重大更新。

本次更新旨在提升用户体验并简化音乐创作过程,包括界面优化、音频质量提升至 48kHz 立体声,以及更直观的控制选项。

Google 与六次格莱美奖得主 Jacob Collier 合作设计, 增加了实时音乐生成和多提示混合功能,使用户能够根据文本提示引导音乐风格。

此外,MusicFX DJ 现在支持用户下载并分享 60 秒的音乐创作,促进创意合作。

同时,Music AI Sandbox 也将迎来更新,虽然具体内容尚未公开,但预计将集成多轨视图等新功能,以支持音乐家和制作人的工作流程。

值得一提的是, 所有生成的音乐都将使用 SynthID 进行版权保护。

🔗 https://deepmind.google/discover/blog/new-generative-ai-tools-open-the-doors-of-music-creation/

🤩 Stable Diffusion 3.5 最强全家桶登场

当我们以为 Stability AI 快凉了,结果它又支棱起来了。

本周, Stability AI 发布了 Stable Diffusion 3.5 全家桶:

Stable Diffusion 3.5 Large:80 亿参数,具备卓越的质量和提示词遵循能力,这一基础模型是 Stable Diffusion 家族中最强大的。该模型非常适合 1 兆像素分辨率的专业应用。

Stable Diffusion 3.5 Large Turbo:Stable Diffusion 3.5 Large 的精简版,仅需 4 个步骤即可生成高质量图像,同时具备出色的提示词遵循能力,因此比 Stable Diffusion 3.5 Large 快得多。

Stable Diffusion 3.5 Medium(10 月 29 日发布):25 亿参数,改进了 MMDiT-X 架构和训练方法,该模型设计为可以在消费硬件上「开箱即用」,在质量与易于定制取得平衡。它能够生成分辨率在 0.25 到 2 兆像素之间的图像。

这几款模型能够生成多种风格和美学,例如 3D、摄影、绘画、线条艺术,以及几乎任何可以想象的视觉风格。

个人和组织可以免费使用该模型进行非商业用途,包括科学研究。

初创公司、中小型企业和创作者可以免费将该模型用于商业目的,前提是年收入总额低于 100 万美元。

向左滑动查看更多官方样张

感受一下官方样张的魅力

🔗 https://stability.ai/news/introducing-stable-diffusion-3-5

🥳 Runway 推出 Act-One AI 动捕

本周,Runway 发布了新工具 Act-One。

据官方介绍,Act-One 可在 Gen-3 Alpha 中使用,无需额外设备,仅用简单视频输入即可为生成的角色制作动画, 轻松捕捉面部的表演精髓。

该工具有一整套内容审核和安全预防措施,包括检测和阻止生成包含公众人物的内容等。

Act-One 的访问权限将逐步向用户推出,很快将向所有人开放。

🔗 https://runwayml.com/research/introducing-act-one

📲 智谱推出 AutoGLM 大模型,可模拟人类操作手机

一句话的事儿,手机自动驾驶就这么水灵灵地来了。

智谱本周五官宣推出 AutoGLM 大模型,拥有「Phone Use」能力,只需接收简单的文字 / 语音指令,它就可以模拟人类操作手机。

据官方介绍,理论上,AutoGLM 可以完成人类在电子设备上可以做的任何事,它不受限于简单的任务场景或 API 调用,也不需要用户手动搭建复杂繁琐的工作流,操作逻辑与人类类似。

智谱表示,在 AndroidLab 评测基准上,AutoGLM 超越了 GPT-4o 和 Claude-3.5-Sonnet 的表现。

目前,AutoGLM Web 已经通过「智谱清言」插件对外发布,可以根据用户指令在网站上自动完成高级检索、总结与内容生成。 手机端 AutoGLM 现已开启内测,暂时仅支持 Android 系统。

🔗 https://mp.weixin.qq.com/s/fUGE8KiwvRkYaGGCNhgsOw

Hunt for Fun|先行

🐼 腾讯研发全球首个大熊猫模型

为了帮助饲养员全方位观察大熊猫,腾讯、中国大熊猫保护研究中心、广东工业大学,联合打造了全球首个大熊猫行为智能识别模型及智慧系统。

它可以识别大熊猫进食、喝水、睡觉等日常行为,并自动生成日报、周报、月报等可视化数据报表。

在腾讯和中国大熊猫保护研究中心的专家指导下,广东工业大学信息工程学院电子信息工程班的同学们,借助腾讯云 TI 平台,快速完成 2 万余张大熊猫图片的行为标注。

项目组通过优化 SlowFast 算法,大幅提升了系统在遮挡环境下的行为识别能力, 目前室内遮挡场景下的大熊猫行为识别准确率提升到了 80% 以上。

为了更精细化地照料熊猫,学生还在此基础上升级了系统,让 AI 能识别大熊猫每次进食的时间和食物种类,包括竹子、竹叶和人工辅食等。

随着数据和算法的不断优化,项目组计划未来将「大熊猫行为智能识别模型」部署到大熊猫保护与研究基地,实时识别、统计、分析每一只大熊猫的行为并生成报告。

🔗 https://mp.weixin.qq.com/s/5MBAl79Q8DAcm5Z1oeLyhA

Hunt for insights|先知

🍎 库克:苹果要做最好的产品

近日,苹果 CEO 蒂姆·库克接受了华尔街日报的采访。

苹果最新产品「Vision Pro」和「Apple Intelligence」的推出是 Tim Cook 所做的两个「巨额赌注」。

对于前者,他表示其「不是一个大众产品」,但「好在先行者的群体足够庞大」。而对于后者,Tim Cook 十分自信,因为它以「最适合客户的方式」诞生,并且「真的改变了生活」。

我们完全不介意不是第一个,」他说,「事实上,要真正做好一件事是需要时间的,这需要大量的迭代,需要关注每一个细节。

有时候,这样做可能需要更长一点的时间。我们宁愿推出这种类型的产品,为人们带来这种贡献,而不是急于第一个发布产品。

「如果我们能做到两者兼得,那自然是极好的。但如果只能选择其一,这里的人毫无疑问都会选择后者。如果你问一百个人,他们会告诉你: 关键是做到最好。

🔗 https://www.wsj.com/style/tim-cook-interview-apple-intelligence-vision-pro-48c59018

❌ 黄仁勋:没有任何一项工作可以完全由 AI 接管

近日,英伟达 CEO 黄仁勋与 Reliance 工业集团的主席穆凯什·安巴尼就 AI 如何引领产业革新进行了深入的对话。

黄仁勋回顾了软件发展的历史,他指出, 过去我们处于人类编写代码的软件 1.0 时代,而现在我们已经迈入了利用机器学习的软件 2.0 时代。

在讨论中,当被问及人类能做而 AI 做不到的事情时,黄仁勋表示,到目前为止,AI 还不能完全替代人类的所有工作。

他表示:「 没有任何一项工作任务可以完全由 AI 接管。这是一个重要的观察。因此,我们每个人都应该利用 AI 进行自动化,让它成为我们的助手,帮助我们完成那 20%、40% 或 50% 的任务。

人们常常问我:『AI 会夺走你的工作吗?』我告诉他们,绝对不会。那些利用 AI 自动化完成 20%或 50% 工作任务的人,才可能替代你的工作。

🔗 https://www.youtube.com/watch?v=D5q4bwrkPBI

🎬 詹姆斯·卡梅隆:AI 技术融合为电影制作带来新突破

上个月,詹姆斯·卡梅隆宣布加入 Stability AI 董事会,让不少网友大跌眼镜。

近日,他参加了在华盛顿举行的 SCSP(Special Competitive Studies Project,特别竞争力研究项目)的人工智能 + 机器人峰会,并在视频致辞中再次提到 AI 等相关话题。

卡梅隆表示,现在正在发生的 AI 和机器人技术的融合,是他一生中最激动人心的技术飞跃之一。

「我非常喜欢 AI 和机器人技术为整个社会所做的贡献,尤其是在我个人的两个激情领域,一方面是艺术和讲故事,另一方面是科学和探索。」

相比于好莱坞同行激进的观点,他提议要主动拥抱 AI。

我对此充满热情,全心投入,计划在将 AI 应用于我的故事创作方面走在前列,就像 32 年前我创立第一家全数字视觉效果公司,成为计算机生成图像领域的先锋一样。

尽管卡梅隆对 AI 的发展前景持乐观态度,但他对 AGI 的发展则持有保留意见。

「AGI 何时会出现,1 年、5 年、10 年?这才是真正的定时炸弹。

无论它何时出现,你都想面临一种拥有自我意识的机器,它可能和我们一样聪明,甚至更聪明,而且在很多方面,它的思考速度更快,更精准,并且它有着无限的成长潜力,因为它能够自我改进代码编写,将使得 AGI 不可避免地走向超级智能。」

并且在他看来,「AGI 很可能会反映出人类自身的特性,即它将具备与我们相似的好与坏。 鉴于人类世界中存在着不少邪恶行为,而且对于何为善良也没有统一的认识,因此 AGI 的发展可能会带来一些问题。这将是一个值得探讨的话题。

🔗 https://www.youtube.com/watch?v=e6Uq\_5JemrI

💡高通 CEO:五年内每个人都会拥有 AI 手机

高通本周推出了新一代骁龙 8 至尊版处理器,CEO Cristiano Amon 在接受彭博电视台采访时,谈到了未来手机的发展。

Amon 认为,在接下来的五年里 ,我们所有人都可能会拥有一部 AI 手机,目前的问题是,要等待使用案例的出现,这在向智能手机过渡时也发生过。

Amon 也对公司从智能手机处理器向汽车、计算、工业领域给予了很高的评价,认为高通非常「有机」地完成了一切,公司有一个非常有竞争力的路线图。

🔗 https://www.bloomberg.com/news/articles/2024-10-22/qualcomm-ceo-says-everyone-will-have-ai-smartphone-in-five-years

彩蛋时间

🐴《白马识途》

作者:@tarcob

工具:Midjourney v6.1

Prompt:Close up front views of a gorgious white horse running up in a small path of the hill of white sand road clibing into clouds made of pink and blue cotton candy and white trees on both side. Sky os light blue. Dreaming landscape

链接:https://www.midjourney.com/jobs/c2b2aab2-811a-4be7-99db-a85d53254aa7?index=0


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1