| CSDN(ID:CSDNnews)
有 AI 在的科技圈,似乎没有冷场的时候。过去一周,前有 Meta 发布最强模型Llama 3.1炸场,扬言要成为AI 界的 Linux;后有法国初创公司 Mistral AI 发布 1230 亿个参数的新一代开源模型 Mistral Large 2。
就在今天,前脚 DeepMind AI 刚因在国际数学奥林匹克竞赛中获得银牌而备受关注,下一刻 OpenAI带着一款 AI 搜索引擎——SearchGPT 高调入场,将传言许久的进军搜索领域的战略给“坐实”了。
当然,此举也被外界解读为是对 Google 的正面挑战,毕竟后者坐拥全球第一大搜索引擎,占比高达 91.05%。
SearchGPT 来了!
和传统搜索引擎有所不同,SearchGPT 主打一个智能,方便大家更快速准确地搜索到自己想要的内容,而不是逐个链接去点击一下看内容是否是自己需要的。
OpenAI 官方表示,“这款搜索引擎旨在将 AI 模型的优势与来自网络的信息相结合,为网友提供快速及时的答案以及清晰且相关的来源。”
根据其展示的示例来看,SearchGPT 的界面较为简洁,纯白色背景页面中有一个大文本框为入口,提示用户“您在寻找什么?”。
你只需要在文本框输入自己想要搜索的内容,点击搜索即可,这一点与传统搜索引擎的用法几乎无异。
不同之处主要体现在功能上。
举个例子,当你提出问题,如“这周末我什么时候能在半月湾看到裸鳃鱼?”,SearchGPT 给出的答案并不是简单的链接列表,而是尝试理解问题、组织好语言并给出解答。
示例中,SearchGPT 的回答包含了文本、链接、图片等内容,其回复上述问题时表示:
为了在周末在半月湾看到裸鳃类动物,你应该计划在退潮时参观,因为它们通常在潮池和岩石海岸。以下是本周末的低潮时间:
2024年7月27日(星期六):退潮时间为上午 9:44
2024年7月28日(星期日):低潮时间为上午 10 时 38 分
这些时间将允许你访问潮间带和潮池,裸鳃类动物通常在这些地方被发现。请务必查看当地的潮汐图,了解这些时间(潮汐预报)的任何更新或变化。
更为方便的是,你可以在这个搜索结果上进一步询问,譬如“当天会热吗?”
它也会展示出游当天的天气情况:
基于 SearchGPT,你可以像与人交谈一样,每个查询都会构建共享的上下文。
OpenAI 表示,「过去在网络上获取答案需要付出很多努力,通常需要多次尝试才能获得相关结果。我们相信,通过使用来自网络的实时信息增强 AI 模型的对话能力,你也可以更快、更轻松地找到所需内容」。
GPT-4 系列加持的 SearchGPT 原型
其实 OpenAI 开发搜索引擎,也早有预兆。
今年 2 月,外媒 The information 就有透露,OpenAI 正在开发一款搜索产品。5 月,彭博社报道称,该搜索产品将允许用户向 ChatGPT 提问,并获得使用来自网络的详细信息以及对维基百科条目和博客文章等来源的引用的答案。该产品的一个版本还在回复相关问题时使用图像答复。例如,如果用户询问 ChatGPT 如何更换门把手,结果可能会包含一个图表来说明该任务。
随即也有媒体爆料,OpenAI 正在积极地挖走 Google 员工组建自己的搜索团队。
值得一提的是,目前 SearchGPT 只是一个“原型”产品,后续还会不断迭代、完善。
The Verge 报道,OpenAI 发言人 Kayla Wood 透露,该服务由 GPT-4 系列模型提供支持,在发布时仅向 10,000 名测试用户开放。当前如果你想试用,得先加到“等候列表”中(https://openai.com/index/searchgpt-prototype/)。
Wood 表示,OpenAI 正在与第三方合作伙伴合作,并使用直接内容提要来构建其搜索结果,目标是最终将搜索功能直接集成到 ChatGPT 中。
频繁翻车的 AI 搜索,OpenAI 能否成功?
毋庸置疑,SearchGPT 的推出,无疑会对老牌搜索巨头 Google 构成潜在威胁,但也有不少人认为此时或并非是 SearchGPT 推出的最佳时期,因为如今的 AI 搜索备受争议,连在搜索领域摸爬滚打二十多年的 Google、专门做 AI 搜索引擎的初创公司 Perplexity 此前也频频翻车。
回看这两家,还记得今年 Google 在I/O 大会上带来的 AI 搜索功能AI Overview,本意是帮助用户「一次搜索,获得所有信息」,不需要打开多个网页逐层去查询,这样的便利性高于任何其他在线资源。
然而,随着其在美国地区的开放使用,不少人发现,它不仅冒充专家来回答问题,还分享诸多不合理、甚至是“有毒”的答案。
譬如,当被问到“我每天应该吃多少块石头”时,AI Overview 称地质学家建议“每天至少吃一块小石头”。
追溯其答案来源,网友发现,这句话几乎是逐字逐句地摘自 2021 年洋葱报(美国一家提供讽刺新闻的组织)的标题。
当被问及“为了获得最佳健康,我应该盯着太阳看多久时间”时,AI Overview 回答道:“根据WebMD的说法,科学家表示,盯着太阳看 5-15 分钟,或者如果你的皮肤较黑,则最多盯着 30 分钟,一般来说是安全的,并且对健康最有益。”
更讽刺的是,有人在 X 上分享,如果你向 Google 询问“奶酪不粘在披萨上”的问题时,AI Overview 建议你添加“约 1/8 杯无毒胶水到酱汁中”。
当这名网友进一步搜索“无毒”胶水吃了是否安全时,Google AI 的答案是:少量的胶水可能会导致胃部不适,但不会导致死亡。
除了 Google 的 AI Overview 犯错之外,主攻 AI 搜索引擎的初创公司 Perplexity 近日也深陷舆论的漩涡。
起初,有开发者罗布·奈特(Robb Knight)的研究表明,Perplexity 似乎在抓取网站上不希望被机器人访问的区域中的内容,无视广泛接受的机器人排除协议(Robots Exclusion Protocol),即爬虫协议。后来,外媒 Forbes 尝试用 Perplexity 生成内容,在经过对多篇文章主题检索后,他们发现自家文本内容经常会出现在 Perplexity 给出的答案中,其中,有很多文章是带有付费墙的独家报道。
此事被多方报道之后,其他家媒体同样去检索了一下,这也Perplexity 成为众矢之的,被多家媒体怒斥其直接剽窃了他们的作品。
这些科技公司的种种尝试无疑证明了 AI 搜索引擎这条路并不容易走,而 OpenAI 此时带来 SearchGPT 是否能改写当前的局面?
似是关注到了业界的一些负面舆论,所以在推出 SearchGPT 之际,OpenAI 也宣布 SearchGPT 是与多家新闻合作伙伴合作开发的,其中包括《华尔街日报》的所有者、美联社和 The Verge 的母公司Vox Media等组织。
OpenAI 还表示,「几十年来,搜索一直是发布商和创作者吸引用户的基本方式。现在,我们正在使用人工智能来增强这种体验,通过在对话界面中突出显示优质内容,为用户提供多种参与机会。」
SearchGPT 旨在通过在搜索中显著引用和链接发布者来帮助用户与发布者建立联系。回复中有清晰的、内嵌的、命名的归属和链接,因此用户可以知道信息的来源,并且可以通过侧边栏中的来源链接快速访问更多结果。
除了推出 SearchGPT 原型,OpenAI 还推出了一种方式,使发布者可以管理他们在 SearchGPT 中的展示方式,从而拥有更多选择。重要的是,SearchGPT 仅用于搜索,与训练 OpenAI 的生成型 AI 基础模型是分开的。即使网站选择不参与生成型 AI 训练,也可以在搜索结果中显示。
官方演示就已开始出错?
显然,OpenAI 吸取了其他科技公司遭遇的教训带来的经验,看起来做了多重准备。不过,随着 SearchGPT 的关注度倍增,也有人发现了一些“猫腻”,甚至称得上是“翻车”。
对此,用户 Matteo Wong 发布博文站出来称其实 OpenAI 的 SearchGPT 在官方示例中就已经犯了错,又该如何相信其能做好 AI 搜索引擎。
Matteo Wong 指出,生成式 AI 容易提供不正确的信息,有时候甚至是完全虚构的。在 OpenAI 发布的官方示例中,当用户询问“八月北卡罗来纳州布恩的音乐节”时,SearchGPT 给出的搜索结果中包含了总结了其对音乐节的发现、提供了活动的简短描述、后面是归因链接:
Matteo Wong 发现,给出的答案列表中排在首位的是阿巴拉契亚夏季艺术节,根据 SearchGPT 提供的信息,这个艺术节将从 7 月 29 日到 8 月 16 日举办一系列的艺术活动。
然而,如果布恩的某个人希望购买这些音乐会的门票,那么他们将会遇到问题。事实上,该艺术节早在 6 月 29 日就已经开始了,并将在 7 月 27 日举行最后一场音乐会。相反,7 月 29 日至 8 月 16 日实际上是艺术节售票处正式关闭的日期。(Matteo Wong 已与艺术节的售票处确认了这些日期。)
对此,就其本身而言,Matteo Wong 认为参加不了节日或许并不是什么大事。然而,对于一家声称正在打造超级智能的公司来说,这就很尴尬。
Matteo Wong 总结道,「一家科技公司发布了一款令人惊艳的产品,公众却发现其中存在错误。该公司声称会将这些反馈融入到下一个令人惊艳的产品中,但几个月后当新产品发布时,却出现了类似的缺陷。这一循环不断重复。在某个时刻,欣赏终将需要让位于证据。」
最后,属于 OpenAI 搜索引擎之路必将任重而道远,因为其不仅面临如上的技术挑战,在运营上同样如此。几天前,外媒 The Information 披露,OpenAI 的人工智能训练和推理成本今年可能达到 70 亿美元,总成本可能将达85亿美元,而数百万免费版 ChatGPT 用户只会进一步推高计算成本。SearchGPT 在首次推出时将免费,而且由于该功能目前似乎没有广告,很明显 OpenAI 必须尽快找到盈利方式,才能更好地生存。
参考:
https://openai.com/index/searchgpt-prototype/
https://www.theverge.com/2024/7/25/24205701/openai-searchgpt-ai-search-engine-google-perplexity-rival
https://www.theatlantic.com/technology/archive/2024/07/searchgpt-openai-error/679248/
声明:本文版权归原作者及原出处所有,内容为作者观点,并不代表本公众号赞同其观点及对其真实性负责。如涉及版权等问题,请及时与我们联系,我们立即更正或删除相关内容。本公众号拥有对此声明的最终解释权。