ChatGPT 搜索引擎演示 demo 大翻车，首批内测网友体验曝光：很快也很强 | Hunt Good 周报

作者：AppSo发布时间：2024-08-02

ChatGPT 搜索引擎人工智能扎克伯格

欢迎收看最新一期的 Hunt Good 周报！

在本期内容你会看到：

6 条新鲜资讯

5 个有用工具

1 个有趣案例

4 个鲜明观点

Hunt for News｜先进头条

💥 ChatGPT 搜索引擎开启内测，GPT-4o 语音模型下周推出

本周，OpenAI 正式宣布搜索产品 SearchGPT 开放内测。

OpenAI 表示，SearchGPT 旨在利用模型的强大能力来检索网络的信息，为用户提供快速及时的答案，并附有清晰和相关的来源。

目前， 这一服务仅对少数用户开放，目的是收集他们的反馈和建议，以便不断优化产品。

值得注意的是，SearchGPT 目前仅是一个试验性的原型产品。眼尖的 CNBC 科技记者发现了SearchGPT官方演示 demo 的几项错误。

例如，当查询「8 月 Boone 音乐节」时，SearchGPT 提供的信息包括已经结束的 Appalachian 夏季音乐节（7 月 27 日结束）和 6 月份举办的 Jones House 音乐节，以及一个距离 Asheville 更近、需要几小时车程才能到达 Boone 的音乐节。

为了丰富搜索结果的内容和多样性，SearchGPT 已经与多家知名新闻媒体建立了合作关系，包括《华尔街日报》和美联社等。

X 网友 @yoimnotkesku 也已经提前内测到了 SearchGPT。从分享的视频来看，SearchGPT 运行的速度非常快。此外，其不光能查询实时天气，而且还能搜索与 OpenAI 达成合作的付费墙新闻报道。

该网友表示，「它非常注重结果，因此有时我需要明确地告诉它具体的操作步骤，而不是仅仅告诉它我想要从网络上获取什么信息。」

此外，OpenAI CEO Sam Altman 在与网友互动时透露， GPT-4o 的语音模式将在下周向会员推出 Alpha 版本。

🔗 https://openai.com/index/searchgpt-prototype/

⚡️ 2024 年值得关注的 10 家 AI 公司

近日，彭博社发布了最新一期的 AI 新锐企业排行榜。

这些企业包括 2024 年值得关注的 10 家规模最大、最重要、资金最充足的初创公司，以及业内 6 家最重要的后起之秀。

这 10 家企业包括 OpenAI、Anthropic、Suno、Perplexity、Mistral、xAI、Scale AI，Cohere，CoreWeave，ElevenLabs。

后起之秀则为 Cognition AI、Helsing 、Imbue、Safe Superintelligence、01.AI、Covariant。

值得一提的是， 01.AI（零一万物）是唯一一家上榜的中国 AI 初创企业。

彭博社评价称，这家由李开复创立的中国 AI 公司，在短短几个月内就达到了 10 亿美元的估值。其最新推出的 Yi-Large 模型，已被一些人视为全球顶尖的 AI 模型之一。

🔗 https://www.bloomberg.com/features/2024-top-ai-startups/?srnd=phx-technology

➕ Google AI 在数学奥林匹克竞赛中获得银牌

继击败人类围棋大师和游戏玩家之后，Google DeepMind 近期又瞄准了数学奥林匹克竞赛。

其旗下 AI 模型 AlphaProof 和 AlphaGeometry 2 成功解答了今年国际数学奥林匹克竞赛（IMO） 6 道题目中的 4 道，距离金牌只有一步之遥。

值得注意的是，2024 年 IMO 的题目并未包含在它们的训练数据中。

AI 工程师 Devin 联创 Scott Wu 发文称，「当我还是个孩子的时候，奥林匹克竞赛就是我的全部。从来没有想过，仅仅 10 年后，它们就被 AI 解决了」。

英伟达高级科学家 Jim Fan 亦发表评论，指出大模型的神秘性： 它们既能在数学竞赛中斩获银牌，却也可能在简单的数字比较问题上出现失误。

🔗 https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

👀 10 万块芯片，马斯克用最大超算挑战 GPT

埃隆·马斯克旗下 xAI 最近官宣了一个由 10 万个英伟达 H100 GPU 组成的 AI 训练集群——孟菲斯超集群。

据悉，孟菲斯超集群被称为「世界上最强大的 AI 训练集群」，旨在推动 xAI 在年底之前训练出 Grok 3.0 模型，届时其有望成为市场上最强大的 AI 模型。

孟菲斯超集群的大规模 GPU 配置和高效的冷却技术使其在处理大规模 AI 模型训练任务时具有显著优势。

此外，其采用的 RDMA 网络架构进一步优化了数据传输效率，这对于密集型的 AI 计算任务尤为重要。相比之下，其他现有的 AI 训练集群虽然在特定应用上表现出色，但在规模和计算能力上不及孟菲斯超集群。

🔗 https://x.com/elonmusk/status/1815325410667749760

🙅 Runway 被曝使用盗版电影和 YouTube 内容进行训练

互联网高质量的数据是 AI 时代的石油，已经被不少 AI 大公司盯上了。

据 404 Media 报道，AI 视频生成独角兽 Runway 动员全公司在互联网收集高质量视频资源，包括但不限于 YouTube、迪士尼、Netflix、索尼以及在线盗版影视资源网站等。

上个月 Runway 发布了备受好评的 Gen-3 视频生成模型，但当 Runway 联合创始人 Anastasis Germanidis 被问及 Gen-3 训练数据的来源时，他含糊其辞地表示：

我们拥有一支内部研究团队，他们负责监管我们所有的模型训练过程，并且我们使用的是经过精心筛选的内部数据集来训练这些模型。

值得一提的是，近期 Anthropic 公司也被曝出，ClaudeBot 网络爬虫在 24 小时内访问了近百万次 iFixit 网站。

iFixit CEO 在 X 平台上公开指责 Anthropic：

你们不仅未经付费就使用了我们的内容，还占用了我们的开发运维资源。如果你们想讨论商业使用我们内容的许可问题，我们随时欢迎。

🔗 https://archive.ph/187xm#selection-1205.0-1205.157

💻 传英伟达将为中国市场准备新旗舰 AI 芯片版本

路透社近日援引知情人士消息称，英伟达正在为中国市场开发一款符合美国现行出口管制的新旗舰 AI 芯片。

两位消息人士称，英伟达将与其在中国的主要分销商合作伙伴之一浪潮进行合作，推出和分销暂定名为「B20」的芯片。

另一位消息人士告诉路透社， 「B20」计划于 2025 年第二季度开始发货。

今年 3 月，英伟达发布了「Blackwell」芯片系列，并将于今年晚些时候量产。在该系列中，B200 在某些任务（如提供聊天机器人的回答）上的速度比前代产品快 30 倍。

🔗 https://www.reuters.com/technology/nvidia-preparing-version-new-flaghip-ai-chip-chinese-market-sources-say-2024-07-22/

Hunt for Tools｜先进工具

🎶 Udio 更新 v1.5 版本，是认真想做音乐

Suno 要有危机感了，Udio 发布新版本 v1.5，可谓是正面硬刚。

更新的一大亮点是支持多语言。官方演示给出了一支普通话的 demo。歌词内容是怪怪的，不过编曲很完整，普通话的演唱也很顺滑，没有「外国人唱中文」的蹩脚感。

音质提升则是这次所有更新里最惊人的，48kHz 的立体声音轨，低音尤其出彩，非常扎实，扛得住 hifi 耳机的音质。新版本还引入了调性控制，以及支持音频生成音频（付费）。

传送地址：https://www.udio.com，免费账户注册即可获得体验积分，每天 10 分，每月首日加赠 100 积分，免费套餐即包含 remix 和扩展功能。

欢迎回看 APPSO 此前文章： Suno 大危机，Udio 更新 v1.5 版本，是认真想做音乐

🔗 https://x.com/udiomusic/status/1816505379200901497

💥 最强开源 AI 大模型 Llama 3.1 登场

本周，Meta 发布了最强开源 AI 大模型 Llama 3.1，包含 8B、70B 和 405B 三种尺寸版本。

Llama 3.1 405B 在多项基准测试中超过了 OpenAI 的 GPT-4o，与 Claude 3.5 Sonnet 等领先的闭源模型相媲美。

该模型的上下文长度提升至 128K，是首个在常识、可操纵能力、数学、工具使用和多语种翻译等方面媲美顶级闭源人工智能模型的公开发布的模型。

Meta 的创始人兼 CEO 马克·扎克伯格强调了开源 AI 的重要性，并表示 Llama 3.1 将成为行业的一个转折点。

此外，英伟达和阿里云、腾讯云纷纷推出支持 Llama3.1 训练推理服务，帮助企业构建和部署自定义的 Llama 超级模型。

🔗 https://ai.meta.com/blog/meta-llama-3-1/

🥊 对标 Llama 3.1 405B，Mistral 推出 Mistral Large 2

如果说上周是小模型扎堆内卷的一周，那么本周则是开源大模型狂欢的一周。

继 Meta Llama 3.1 之后，「欧洲版 OpenAI」Mistral AI 发布了开源 AI 大模型 Mistral Large 2。

Mistral Large 2 拥有 1230 亿个参数，支持 128K 上下文，在代码生成、数学推理、多语言支持和高级函数调用等方面表现出色。

Mistral Large 2 在多项基准测试中的表现与 GPT-4、Llama 3.1 和 Claude 3.5 Sonnet 等先进模型相当。在代码生成和数学推理方面，该模型的性能甚至超过了 Llama 3.1 405B 的模型。

🔗 https://mistral.ai/news/mistral-large-2407/

📹 AI 视频工具 Vozo 上线即走红

近期，一款 AI 视频工具 Vozo 自推出以来便迅速攀升至 Product Hunt 排行榜首位。

Vozo 的显著优势在于，它能够依据用户提供的关键词，智能生成全新的视频剧本，同时采用语音克隆技术，为视频重新配音，确保声音与原说话者高度相似，并实现口型与配音的完美同步。

在订阅方案上，Vozo 提供了多种选择，包括免费版、标准版、专业版以及企业版，以满足不同用户的需求。

免费版用户可以在限定时间内无限次地免费重写视频。除此之外，免费版还提供了 30 分钟的视频剪辑时长、3 分钟的视频翻译时长以及 1.5 分钟的口型同步时长。

附上体验地址：https://www.vozo.ai/

🔗 https://lionherald.com/vozo-introduces-revolutionary-video-editing-tool-rewrite-redub/

👏 只需 30 秒，快手这个工具就能让你的表情包自由

和朋友聊天总是找不到表情包？

试试这个工具，保准你能成为朋友圈里的表情包之王。

Hunt for Fun｜先行

⏰ π，每个人的时间闹钟

我们能在无穷无尽的 π 中找到当前的时间吗？

下面要介绍的这个网站 「https://pi-clock.com/?clock-type=24」正是这个问题的最好答案。

该网站用 π 数字来实时显示当前确切时间，随机变换颜色的背景搭配跳动闪烁的 π 也别有一番趣味。

有时候，最简单、最无序的存在，恰恰能引发我们对时间的深刻思考。

🔗 https://pi-clock.com/?clock-type=24

Hunt for Insight | 先知

🧐 前 OpenAI 技术大神：模型对自己知识和能力的自我认知

最近 AI 大模型又因为数不清 Strawberry 单词里面有多少个 r 而遭到嘲笑。

这个问题也引起了前 OpenAI 大神 Andrej Karpathy 的注意，他在 X 平台上发文称：

为了帮助解释大模型（LLM）的怪异之处，我想到了一个有趣的方法，即将每个 token 翻译成一个独特的表情符号。

这更接近于事实——每个标记基本上就是它自己的「象形文字」，LLM 必须从头开始学习它的含义，这基于训练数据的统计数据。

所以下次当你问 LLM「草莓」这个词中有多少个字母「r」时，请有些同情心，因为你的问题看起来是这样的：👩🏿‍❤️‍💋‍👨🏻🧔🏼🤾🏻‍♀️🙍‍♀️🧑‍🦼‍➡️🧑🏾‍🦼‍➡️🤙🏻✌🏿🈴🧙🏽‍♀️📏🙍‍♀️🧑‍🦽🧎‍♀🍏💂

Andrej Karpathy 还特意写了个用表情来表示 token 的小程序，帮助我们更直观地看到大模型眼里的文字世界。

附上体验地址：

https://x.com/karpathy/status/1816637781659254908

他认为， LLM 缺乏「cognitive self-knowledge」（认知自我知识），即模型对自己知识和能力的自我认知。

如果模型能够具备这种自我认知能力，它在遇到不擅长的问题时，可能会选择使用其他工具或方法来解决问题，例如使用代码解释器来解决数字母问题。

🔗 https://x.com/karpathy/status/1816637781659254908

🫡 Mr. Cooper CIO：生成式 AI 不能包治百病

生成式 AI 不是神医，也不能包治百病。

非银行抵押贷款服务公司 Mr. Cooper 首席信息官 Sridhar Sharma 认为，在某些情况下，我们需要平衡一种观点，即我们应不断地利用 GenAI 做更多的事情。

然而，一些人却表示，他们感受到了一种压力，即他们可能觉得有必要使用更复杂或更先进的技术，哪怕这些问题可能通过更简单或更传统的方法就能有效解决。

例如，Sharma 提到，过去三年中，Mr. Cooper 公司一直使用非生成式 AI 技术来检查文档中是否遗漏了某些信息，如签名、印章或公证日期。

该公司尝试过使用生成式 AI 来更有效地解决这个问题，但结果发现它并不适用。

后来，Sharma 也意识到，生成式 AI 并不是解决所有问题的灵丹妙药，实际上，在某些情况下，它可能并不那么有效，有时甚至成本更高，并且更容易可能带来风险。

🔗 https://www.wsj.com/articles/a-clamor-for-generative-ai-even-if-something-else-works-better-d9bd0257?mod=tech\_feat1\_ai\_pos1

🤖 Coatue 投资者：机器人不太可能会出现 ChatGPT 时刻

对冲基金公司 Coatue 多位投资者最近探讨了关于机器人技术是否会有一个「ChatGPT 时刻」。

他们认为，由于物理限制、高昂的初始成本和生态系统的初期阶段， 机器人技术不太可能经历这样的「ChatGPT 时刻」，即一个让大众感受到 AI 机器人潜力的惊人瞬间。

相反，机器人只会平滑地过渡到主流市场，未来人类每个人在与咖啡馆或家庭中的机器人互动时，都会体验到属于自己的独特「机器人时刻」。

他们预测，与大型语言模型一样，机器人技术将得益于研究的加速、计算资源的普及和资本的充裕，但数据稀缺、供应链限制和硬件局限等挑战依然严峻。

🔗 https://www.coatue.com/blog/perspective/robotics-wont-have-a-chatgpt-moment

🤯 扎克伯格深度专访：美国别想长期领先中国

在最强开源大模型 Llama 3.1 发布之际，彭博社放出了对 Meta CEO 马克·扎克伯格的专访。

扎克伯格表示，虽然 Meta AI 目前只发布了几个月，但其目标是让 Meta AI 在今年年底时成为世界上使用量最大的 AI 助手。

他指出，Meta 公司不希望未来由一个 AI 主导整个市场，市面上应该有数百万乃至数亿种不同的模型。

当被问及 AI 是否为泡沫时，扎克伯格认为随着时间的推移，许多所谓的泡沫最终也会变得很有价值，这只是一个时间问题。他还透露现在 Meta 已经在研究 Llama 4 了。

此外， 他认为虽然保持长期领先中国 5-10 年可能是不现实的，但通过持续创新，保持 6-8 个月的领先则更为可行和重要。他还提到，企业应与政府合作，确保技术上的持续进步。

🔗 https://www.bloomberg.com/news/articles/2024-07-23/meta-s-zuckerberg-aims-to-rival-openai-google-with-new-llama-ai-model

彩蛋时间

《观察》

作者：@rohacjuraj

工具：Midjourney

链接：https://x.com/rohacjuraj/status/1817317324724019439

ChatGPT 搜索引擎演示 demo 大翻车，首批内测网友体验曝光：很快也很强 | Hunt Good 周报

推荐体验

相关资讯

搜索引擎巨变！Google 版「Midjourney」来了，绘画菜鸟秒变艺术大师 | Hunt Good 周报

OpenAI旗下AI搜索引擎SearchGPT官方演示被曝翻车

OpenAI搜索引擎SearchGPT开放内测

苹果 CEO 库克： Apple 智能很强，能让人少刷手机 | Hunt Good 周报

OpenAI搜索产品曝光：AI即将颠覆搜索引擎！

近期资讯

百川智能与北京市海淀区卫健委签署战略合作，AI全科医生助力基层医疗提质增效

“腾讯系”3D技术服务企业元象VR项目入驻深圳西涌

QuestMobile报告：鸿蒙生态潜力巨大，鲸鸿动能“空间音频”式营销创新体验

八五九分公司多措并举为农业现代化发展注入强大动力

AI助力医疗“把诊问脉” 贝瑞基因打通基因组数据链堵点

北碚实验幼儿园教育集团：彩绘中华年，“非遗”集市乐翻天

3DM 2024硬件年度最佳评选：年度好物一网打尽

家居资讯｜安徽省含山民生瓷业有限责任公司召回6000只面碗

送礼！2025第一个赚钱窗口，来了

中国测试军用5G，机器人将取代解放军战士，成为未来战场主力？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响