当前位置:首页|资讯

谷歌Gemini为何不受开发者待见?操作复杂表现能力不够突出

作者:36氪的朋友们发布时间:2024-09-18

腾讯科技讯 据国外媒体报道,谷歌对大语言模型进行了巨额投资,但Gemini仍面临着操作复杂以及开发者倾向于选择竞争对手产品的双重挑战,这些问题可能对其云服务和人工智能业务的增长造成影响。Gemini自发布以来取得了一些进步,但在可靠性和市场占有率方面,与OpenAI等竞争对手相比仍有显著差距。

一些开发者和谷歌员工吐槽称,相对于竞争对手的技术,谷歌的对话式人工智能Gemini使用起来要过于复杂。在吐槽Gemini的开发者当中,包括初创公司Topology的创始人艾丹·麦克劳克林(Aidan McLaughlin)。这家公司开发软件以提高现有人工智能模型的推理能力。

他表示,他第一次尝试使用OpenAI的应用程序接口时,仅用了30秒,而使用Gemini却花费了4个小时,因为谷歌要求他设置云账户并进行大量配置。此外,谷歌系统中的漏洞有时还迫使他回溯(backtrack)。麦克劳克林说:“如果谷歌提供的模型在能力上明显超越了OpenAI和Anthropic所提供的模型,我愿意克服所有这些困难。世界上最重要的事情就是模型的优劣,但除一些特殊情况,谷歌的模型似乎只能排在第三位。”

开发者在使用Gemini时遇到的困难可能会对谷歌的云业务产生影响,因为谷歌希望利用Gemini吸引更多客户使用其服务器租赁业务。此外,一些谷歌员工表示,这也可能会对谷歌本身人工智能的发展造成潜在问题。OpenAI通过吸引数百万付费用户购买其人工智能模型或使用ChatGPT,获得了大量关于人工智能性能的隐式和显式反馈,从而进一步对模型进行改进。如果谷歌的Gemini没有得到同样水平的使用,该公司就可能使用一个更模糊的路线图来进行同样的改进。

Gemini对于谷歌的消费者和广告产品的开发也很重要,这些产品需要提供对话式答案搜索和语音助手。“让开发者使用Gemini来解决复杂的现实世界问题,对于下一代Gemini来说是至关重要的反馈,”Abacus AI的首席执行官宾度·雷迪(Bindu Reddy)说。该公司的软件帮助开发者构建人工智能应用程序。“你拥有的反馈越多,就越好,”她说。

尽管Gemini在今年已经有了很大的改进,但在为人工智能商业应用提供支持方面,它仍然不如竞争对手的模型可靠。谷歌发言人表示,开发者的反馈对于改进Gemini模型非常重要,但这不是唯一的数据来源。一些人工智能研究人员也表示,通过传授人工智能向各个领域的人类专家学习,也有可能实现重大改进。

小型开发者和大公司采用像OpenAI的GPT-4这样的大语言模型开发应用程序,这些应用程序可以自动化从客户服务和数据分析到欺诈检测和生成计算机代码的所有内容。OpenAI和微软每月通过向开发者提供大语言模型服务各自获得约1亿美元的收入。这些开发者包括包括像Jane Street这样的量化交易公司、像摩根士丹利这样的银行以及像Stripe这样的金融科技公司。

谷歌也列出了Gemini的若干客户,包括梅赛德斯-奔驰、高盛和Uber。这些公司在声明中表示,他们使用人工智能来推动从客户服务到编码协助的所有事情,尽管他们购买的程度还不得而知(谷歌此前设定了一个目标,即今年在北美通过人工智能云服务获得10亿美元的收入,但它销售的人工智能服务不仅仅是大语言模型。

谷歌母公司Alphabet的首席执行官桑达尔·皮查伊(Sundar Pichai)在7月份的公司第二季度财报电话会议上表示,自今年年初以来,已经有超过200万开发者使用了Gemini,但目前还不清楚这是否包括只尝试使用过一两次模型的开发者。

相对于OpenAI的模型而言,Gemini在开发者中的不受欢迎程度,似乎是业内一个公开的秘密。尽管如此,谷歌的Gemini仍在不断进步,该公司也在积极采取措施以改善其性能和可靠性,以期在人工智能领域保持竞争力。

竞争优势

例如,企业软件初创公司Retool在今年6月对750多名科技工作者进行的一项调查发现,只有2.6%的受访者表示他们最经常性地使用Gemini来构建人工智能应用程序,而有76%的人表示他们使用的是OpenAI。Gemini以微弱优势超过了Anthropic的Claude,后者的得票率为2.3%。但值得注意的是,Claude的使用率自Retool 2023年11月的报告以来增长了四倍多。Gemini直到去年12月才对开发者开放。

跟踪网站流量的Similarweb表示,从6月到8月,OpenAI的应用程序开发者页面获得了8280万次访问,而谷歌的页面在同一时期只有840万次浏览。规模较小的调查也提供了类似的证据。上个月末,Finetune的创始人朱利安·萨克斯(Julian Saks)询问了他旧金山共享工作空间中的50名人工智能初创公司开发者,他们最常使用的对话式人工智能模型是什么。他们中几乎所有人都说主要使用的是Anthropic或OpenAI的模型,没有人主要使用Gemini。萨克斯对这种结果并不感到惊讶。他说:“我觉得在编码方面,Gemini与其他模型相比并不突出。”

谷歌花了将近一年时间和一次重大重组才推出了一个能与OpenAI在2023年初发布的GPT-4竞争的模型。谷歌从2023年12月开始让开发者访问Gemini模型,它们在流行的对比评估中的性能与OpenAI的模型相近。

但一些谷歌员工表示,OpenAI的先行一步为其在开发者中赢得了品牌认可。今年,另一家年轻的人工智能初创公司Anthropic随着开发者将Claude作为OpenAI的替代品(特别是用于编码辅助)而声名鹊起,享受了口碑营销的激增。

开发者的困扰

Gemini似乎并没有引起太多关注。受调查的开发者们表示,Gemini模型在分析长篇文档或代码库时非常有用,因为它们可以一次性处理比其它模型更多的信息。但他们也指出,与竞争对手相比,谷歌提供的使用选项令人困惑,步骤繁多,以及其开发者系统与OpenAI的不同,使得使用这些模型变得更加困难。

有时,谷歌提供的使用Gemini的不同选项甚至在谷歌自己的搜索结果中相互竞争。今年春季的一段时间,Vertex AI Studio--谷歌向可能想要使用Gemini的大企业推广的服务--成为了Google AI Studio的赞助结果,而后者是一个更简单的工具,让开发者能够使用Gemini。

“人们在试图弄清楚这些选项时会感到困惑,”OpenSea的前首席技术官亚历克斯·阿特拉(Alex Atallah)说。他在尝试为自己的初创公司OpenRouter使用Gemini时也遇到了类似的困难,OpenRouter为使用大语言模型的开发者制作软件。

尽管谷歌去年12月推出了AI Studio服务,旨在让开发者更容易使用Gemini,但他们必须使用与GPT和Claude不同的查询发送方法,这两种模型共享类似格式。麦克劳克林对此表示,这一差异使得开发者转向Gemini的吸引力降低。

Gemini经常在社交媒体上遭到吐槽--尤其是在社交媒体平台X上。安全初创公司Xbow的人工智能研究员布伦丹·多兰-加维特(Brendan Dolan-Gavitt)本月初在X上发布了一篇关于他通过Vertex(谷歌的另一款人工智能应用开发应用程序)开始使用Gemini需要经历众多步骤的帖子,引起了广泛关注。其他开发者也纷纷加入吐槽的行列,表达了对谷歌Gemini的不满。

稳定市场份额

谷歌正试图改变这种形象,包括在X上回应Gemini的批评者。它还为开发者举办活动,对Gemini进行推广。谷歌还在尝试其他激励措施,比如举办开发者竞赛,以构建最佳的Gemini驱动应用程序,第一名获胜者将获得一辆定制款的DeLorean品牌电动车,车牌号为“G3M1N1”。按照计划,谷歌将会在今年年底公布最终的获奖结果。

从事谷歌产品开发工作洛根·基尔帕特里克(Logan Kilpatrick)透露,谷歌还在考虑合并一些重叠的应用程序构建产品的功能,以减少开发者之间的混淆。他说:“OpenAI在大语言模型API的背景下,为开发者提供了更长时间有用的东西,比谷歌略长一些。”他于4月份加入谷歌,担任AI Studio的产品领导,此前在OpenAI负责开发者关系。“我们必须对抗他们目前在开发者中固有的稳固市场份额。”

本周,OpenAI推出了推理模型o1-preview,它在一些技术或复杂任务上的表现优于大语言模型。这可能会给谷歌带来压力,要求其发布类似的技术,否则就有可能在开发者舆论场上失去更多的地盘。

“白手套”服务

谷歌正在积极开发Gemini的2.0版本,意在人工智能领域的竞争中取得持久战的胜利,以期赶上甚至超越OpenAI的技术。尽管如此,Gemini也赢得了一些支持者的青睐,特别是它在处理信息量方面超越了其他模型。Starcycle的创始人洁欣·休(Jaclyn Siu)表示,她的公司正在使用Gemini 1.5 Pro,这是谷歌为开发者提供的最尖端的大语言模型,主要用于从文档中提取数据。Thomson Reuters也在使用Gemini来辅助法律工具,该工具能够比较长篇法律文件并识别出其中的不一致之处。

对于规模较大的公司而言,谷歌人工智能的使用难度并不是一个主要障碍。Wayfair的首席技术官斐奥娜·谭(Fiona Tan)透露,该公司享受到了谷歌员工提供的“白手套”服务,他们正在协助公司利用Gemini将传统的数据库转换成更易于使用的格式。所谓的“白手套”服务,通常指的是那种非常细致周到的服务,它需要对细节给予极大的关注和照料。

然而,一些开发者并不打算尝试Gemini,因为他们现有的解决方案已经足够有效。正在开发一个名为Dots应用程序的马滕·斯特里多姆(Martyn Strydom)指出,他的公司更倾向于使用Claude作为编码助手,以及使用OpenAI的旧版GPT模型来响应客户,因为他们没有时间去不断测试不同的语言模型。

他说道:“目前,几乎所有人都在用OpenAI、Claude或Cursor。如果全球顶尖的工程师都在使用这些工具,我们为何还要尝试其他的呢?”Cursor是一个由OpenAI和Anthropic模型驱动的人工智能代码助手。

本文来自“腾讯科技”,编译:无忌,36氪经授权发布。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1