集微网消息,距离3月16日百度公司推出类似ChatGPT的聊天机器人还有一周时间,这家中国最大的搜索引擎运营商的员工表示,他们正在抓紧时间赶在最后期限前推出,而这款聊天机器人仍难以完成一些基本功能。
据知情人士向华尔街日报透露,为了开发这款名为Ernie Bot的人工智能聊天机器人,数百名员工一直在夜以继日地工作。他们表示,其他团队已被要求借出他们的员工和强大的计算机芯片,因为美国的制裁,中国公司无法再购买这些芯片。
一些知情人士表示,在预计推出之前,作为聊天机器人基础的人工智能模型仍在接受数据训练,这是中国科技行业备受期待的一件事。一些员工表示,他们没有足够的时间来打造一款功能良好的产品。
知情人士还表示,百度计划分阶段推出这款产品,首先向有限的用户开放公开测试。上个月,百度表示首先将Ernie Bot嵌入到其搜索引擎中,并将于3月向公众开放。
百度的美国存托凭证周四下跌7.5%。纳斯达克金龙中国指数下跌5.4%。
百度表示已与400多家中国公司签署协议,这些公司将能够在其产品和服务中使用Ernie Bot。百度表示,作为回报,聊天机器人将获得在不同场景中运行的经验,以帮助提高其性能。
百度近年来失去了投资者的青睐,成功上市可能有助于该公司重新跻身中国著名科技公司的行列。失败可能会导致百度遭受与谷歌类似的命运,直到最近,谷歌一直坚持对人工智能采取相对谨慎的态度,谷歌的人工智能聊天机器人搜索在演示中产生与事实不符的错误后,其市值损失了1000亿美元。
百度拒绝对此置评。
Ernie Bot可能是中国第一个与ChatGPT竞争的产品,ChatGPT是由位于旧金山的人工智能研究公司OpenAI开发的。中国和美国一直在竞相增强各自的战略技术优势。
知情人士表示,北京市官员还提醒百度,确保其服务符合中国的法律法规,包括数据收集和处理,以及国家严格的互联网审查规定。
本周,中国科技部部长王志刚表示,开发类似ChatGPT的产品将很困难:“踢足球就是运球和射门,但要像梅西那样出色并不容易,”他补充道,中国长期以来一直在研究这一领域,但“我们必须等等看,我们是否能取得像OpenAI那样的成果。”
多年来,百度一直在大力投资开发大型语言模型,这是ChatGPT将谷歌和OpenAI的英语版本改编为中文的技术基础。百度在2019年发布了第一款模型,取名为Ernie。
去年12月底,随着ChatGPT的热度越来越高,百度首席执行官李彦宏向员工介绍了新的进展。根据《华尔街日报》看到的一份内部记录,他表示:“我们有这么酷的技术,但我们能把它变成每个人都需要的产品吗?这实际上是最困难的一步,但也是最伟大、最有影响力的一步。”
知情人士表示,今年1月初,百度的高管告诉其自然语言处理团队,开始将类似ChatGPT的产品与Ernie模型结合起来。
但他们表示,该项目面临着挑战,其中许多挑战已被其他从事类似ChatGPT技术的人工智能开发人员所共享。一个挑战是让模型更准确地响应用户的请求,教它消除具有多种含义的短语或可以指代多个人的名称之间的歧义。另一个挑战是让聊天机器人生成更像人类的语言。
第三个挑战是提高其事实准确性,这是大型语言模型的技术限制。大型语言模型是根据不同单词出现在一起的概率而不是根据信息片段来组合句子的。这种限制也使得这些模型难以控制,从而避免敏感话题,这是审查的障碍。
知情人士表示,百度已聘请承包商帮助审查和改进聊天机器人的答案。
知情人士表示,每一步都需要时间。人工智能研究人员表示,正确训练这种拥有数千个芯片的模型可能需要几周或几个月的时间。
知情人士表示,本周,工程师和产品经理都在忙着改进Ernie Bot的基本功能,比如它对用户请求的响应速度,以及它汇总搜索结果的方式。
知情人士表示,开发团队一直没日没夜地工作,包括1月底为期一周的春节假期。他们表示,该项目目前已从创建一个能够用中文和英语对话的双语聊天机器人简化为一个主要用中文对话的聊天机器人。
知情人士表示,Ernie Bot的研发工作一直由百度的首席技术官王海峰负责,主要由百度技术开发部门进行,该部门包括自然语言处理团队和移动生态系统业务集团。一些知情人士表示,百度的人工智能云部门正在提供云计算支持。
为了加快这一进程,高管们集中了更多的资源。知情人士表示,春节假期结束后,李彦宏要求全公司的人工智能研究团队(包括其自动驾驶部门)借来其最强大的计算机芯片英伟达公司的A100用于Ernie Bot开发。美国去年年底实施的芯片制裁禁止中国公司购买新的A100芯片。一些知情人士表示,公司还调来员工帮忙,特别是清理培训数据,比如过滤掉低质量的内容。百度还聘请了外部团队进行数据清理。
由于时间紧张,一些员工对Ernie Bot能否达到用户或市场的预期感到不安。一些员工表示,出于这些担忧,他们已在发布前出售了一些公司股票。(校对/周宇哲)