新晋人工智能霸主OpenAI开始挑战搜索市场格局。
OpenAI很可能推出基于ChatGPT技术的新搜索引擎。5月6日,界面新闻注意到,名为“GPT Search”的网页已经上线,但目前只有会员才能访问。
上述消息最早是创业孵化器Y Combinator中的一篇帖子透露的,文中称“search.chatgpt.com”的域名和安全证书已经创建。知名记者Pete Huang也发推特预告,表示GPT Search将在5月9日正式上线。
OpenAI如何提供更个性化的深度集成搜索体验,以及带来怎样的人与信息的交互方式变革备受外界期待。自从ChatGPT诞生,科技圈都在等待着一场OpenAI与谷歌在搜索市场的正面对决。已经有大量用户通过微软的Bing Chat、谷歌的Gemini等聊天机器人,获得人工智能生成检索答案。
目前,OpenAI估值超800亿美元,微软已向该公司投入130亿美元。OpenAI在搜索市场上显得“野心勃勃”。
“将LLM(大型语言模型)与搜索进行深度集成,ChatGPT可能是搜索的未来。”今年4月,OpenAI首席执行官Sam Altman已经向人们昭示了该公司的宏大野心。
这家手握微软130亿美元投资的公司,目前估值超800亿美元。无论在技术还是资金上,它已然成为能够威胁到谷歌搜索地位的新势力。
事实上,OpenAI已经在借助微软之力不断向搜索引擎逼近。去年5月,微软在其“2023 Build开发者大会”上宣布,Bing搜索将很快直接集成到OpenAI的ChatGPT聊天机器人中,从而在Bing上内置部分实时搜索功能。
微软还表示,ChatGPT将内置一个世界级的搜索引擎,以提供更及时、更新的答案,并从网页上获取信息。
彼时,微软公司CEO、董事长萨提亚·纳德拉曾乐观地表示,“整个搜索类别正在经历翻天覆地的变化,这样的机会很少出现。”
更有乐观者认为,此举或将成为人工智能的“iPhone时刻”,有望削弱或颠覆谷歌在搜索市场的主导地位。
到了去年10月,微软Bing将OpenAI最新版本的图像生成模型DALL-E3纳入其中,帮助访问者生成逼真的图像,从而提升用户使用频率。
微软公司副总裁兼Copilot和Bing工程与产品负责人Jordi Ribas称,“DALL-E3加入后,必应使用量增加了10倍,这确实对产品的参与度和用户产生了影响。”
彭博社分析称,2023年第二季度,美国Bing月度活跃用户同比增长一倍以上,达到310万,用户在搜索引擎上花费的时间增加了84%。SensorTower的数据则显示,到年底,Bing的月活跃用户已稳步增长至440万。
然而要谈Bing挑战谷歌的霸主地位还为时尚早。StatCounter数据显示,截至2023年底,微软Bing仅占全球搜索市场的3.4%,自宣布集成ChatGPT以来,其市场份额上升了不到1个百分点,而谷歌仍然占据全球90%的搜索市场总量。
对搜索而言,数据是决定搜索质量的关键因素,即搜索次数越多,搜索答案越精准。
生成式人工智能将如何改变搜索及排名结果,也将对谷歌颇为依赖的广告模式产生影响。过去,搜索广告主要依靠点击次数盈利,导致大量劣质广告信息前置,用户体验极差。在中国,类似的情况同样存在。
“如果我们能够建立一个比谷歌更好的搜索引擎,那就应该这样做。”Sam Altman指出:“谷歌向你展示了13个广告和10个蓝色链接,也许有更好的方法来帮助人们搜索信息,并根据提示采取行动。”
但要拿下搜索市场,还需要硬件公司和内容数据方的深度配合。眼下,OpenAI仍为搜索数据所困。
就在4月30日,奥尔登全球资本旗下的八家日报起诉OpenAI和微软,指控两家公司非法使用新闻文章为其人工智能聊天机器人提供动力。
这些公司在诉状中称,OpenAI和微软在未经许可的情况下使用数百万篇受版权保护的文章来训练和喂养他们的生成式人工智能产品,包括ChatGPT和Microsoft Copilot。该诉讼没有要求具体的金钱赔偿,但要求陪审团审判,并表示出版商因使用内容而应获得赔偿。
“我们花费了数十亿美元在出版物上收集信息和报道新闻,我们不能允许OpenAI和微软扩大窃取我们工作成果,以牺牲我们的利益为代价建立自己的业务。”奥尔登报纸的执行主编Frank Pine在一份声明中说。
OpenAI发言人则回应称,公司此前并不了解奥尔登的担忧,但正在与许多新闻机构建立合作伙伴关系并进行对话,以探索合作机会。当地时间5月6日,英国《金融时报》宣布已与OpenAI达成内容许可协议,后者能够利用其数据库来训练GenAI模型。
与此同时,不少作家也开始行动,包括玛格丽特·阿特伍德、丹·布朗和乔迪·皮考特在内的8500多名作者,联合敦促ChatGPT和Bard等负责生成人工智能应用的科技公司,在未经适当授权的情况下停止使用他们的作品或提供补偿。
《纽约时报》最近的一项调查发现,许多科技公司在努力跟上人工智能步伐的过程中忽视了相关政策,并讨论规避版权法,以获取尽可能多的数据来训练聊天机器人。国内的大模型同样无法避免这一问题,各类大模型产品的参考答案多来自于媒体报道或已有的数据。
生成式人工智能从根本上改变搜索市场,距离这一天也许不会太遥远。但在此之前,这些AI公司需要首先解决好数据来源以及版权争议等问题。
本文来自“界面新闻”,记者:陈振芳,编辑:宋佳楠,36氪经授权发布。