短短几个月前,OpenAI发布了ChatGPT,并瞬间引爆全球。如今,其活跃用户已经超过1亿,凭借的就是生成与人类相似且语法准确的响应内容。同类技术甚至可以根据输入的描述生成艺术品和编程代码,效果同样不错。
如果初步得到的回复无法令人满意,你还可以持续跟AI互动,比如提出额外的问题或者通过补充和澄清调整图片或代码内容,让结果更符合你的预期。整个过程不需要劳烦领域专家、艺术家或者程序员,会说话就能实现。
但生成式AI也有自己的问题,例如用于训练底层AI模型的数据来源可能存在争议、训练数据应如何流通、缺乏对源数据的使用权限、模型中存在偏见,还有更重要的一点——响应内容的准确性,特别是“一本正经的胡说八道”。
但这种种问题,丝毫没有阻止软件公司尝试生成式AI。企业看到了这背后蕴藏的巨大商业潜力和用户热情,他们当然不想落后。
Salesforce、Forethought和Thoughtspot最近都在公布自己的生成式AI测试方案。
Salesforce跨自家平台推出生成式AI,Forethought希望打造新的聊天机器人,THoughtspot则希望利用AI改善数据查询。每家公司都在基础技术之上添加了一些算法微调元素,以体现自身平台上的独特需求。
微软则宣布,面向Azure企业用户的OpenAI Service现在以托管服务的形式全面开放。
整个2023年,相信会有更多企业加入战团。但我们前面提到的限制仍然真实存在,所以新的问题来了:无论表面上看起来有多酷,无论开发商如何强调仍处于早期开发阶段,生成式AI真的做好准备为企业服务了吗?
从局限性说起
企业客户正努力将AI引入商业目的,但其中仍存在着太多未知数。
目前,生成式AI的底层模型仍在使用互联网数据进行训练,并没有充分满足各种许可要求。无论是网站、书籍还是文章文本,这种广泛采集训练素材的作法对每个人都将造成切身影响,对以商业目的创建内容的公司影响尤甚。
Salesforce公司创始人Marc Benioff在之前接受采访时表示,这确实是个明显缺陷,但也没有妨碍Salesforce上击发布Einstein GPT。
这位CEO当时强调:“我们都感受到了ChatGPT令人兴奋的能力,但也能看到它的局限性。它其实就是最终‘剽窃者’,它所学习的东西都是从别人那扒来的。所以它的边界,也就是它所能爬取的内容的边界。”
更重要的是,其中很多内容根本就不靠谱,或者至少包含一定错误。OpenAI在其技术局限性清单中也公开承认了这一点,写道:“ChatGPT有时会给出看似合理,但并不正确甚至错到荒谬的答案。而且这个问题很难解决……”
Forethought公司CEO 兼联合创始人Deon Nicholas认为,生成式AI面临的最大问题就是错误答案。“ChatGPT仍然摆脱不了‘幻觉’,对吧?问它一个关于特定业务的问题,如果它不知道答案,那就只会编造出一些看似合理、但实际上完全错误的东西。”
此外,ChatGPT用于训练的信息截止于2021年,这对希望创建新业务的公司来说也是个问题。
还有偏见问题,需要由多元化团队认真关注模型和训练数据,才有可能真正实现缓解。上周,微软客户体验产品营销主管Neha Bajwa在采访中也谈到了AI偏见问题的重要性。
“在微软,我们称之为‘负责任AI’,也就是通过对偏见和包容性的关注保证数据中不存在偏见,使AI具备合理的道德观点和负责任特性。必须注意,数据会放大偏见。”
破解之道
但这些局限性并非不可克服。最近,已经有多家生成式AI工具开发商开始采用OpenAI的基础模型,并将其转化成自己的技术以解决其中某些问题。虽未彻底消除,但这方面努力必将成为下一阶段的工作重点。
O’Reilly Media创始人、董事长兼CEO Tim O’Reilly将ChatGPT视为真正的第三次网络浪潮,但表示可能还需要做一些微调才能满足内容所有者的商业需求。
OpenAI CEO Sam Altman已经与O’Reilly接洽,希望能使用O’Reilly图书目录获取知识训练语料库。但O’Reilly表示反对,因为这种方式目前还缺乏合理的作者补偿机制。
O’Reilly表示:“我说过,除非你们找到……某种付款方式,因为这些内容是拥有明确主体的,人们也愿意为此付费。”他建议建立一套系统,确保用户在付费之后才能访问这类专业内容。
“支付的款项将交给源内容的所有人。也许我们会为此建立起商业模式,让人们可以访问这些更权威的内容。”
这样做的一大优势,在于拓宽生成式AI的功能广度,包括文本、艺术和代码。Nicholas认为,如果未来的模型能够根据工作流程生成编码,或者自动创建或调整执行方式,必将成为技术应用企业的强大助力。
“我要补充一点,大家可能还没有意识到。像GPT-3这样的生成式模型可以生成代码,当然也可以用来生成实时工作流,而且效果相当不错。所以它代表的不只是个能像人一样跟我们对话和思考的AI模型,更将成为很多工作中的重要依托——包括生成Python代码,也包括生成自动化工作流程。”
数字体验和数字化战略咨询公司Acquia CTO Dries Buytaert曾一手创立起开源Drupal内容管理系统。他在最近的博文中,介绍了生成式AI在内容管理和日常业务中的应用前景。
在最近的采访中,Buytaert将AI技术的发展与云计算做了比较。通过开放对计算资源的低门槛访问,云计算已经从根本上重塑了企业计算的面貌。
“OpenAI所构建的不只是产品,更是AI工具的大众化趋势。它让很多没有机器学习和AI博士学位的人们也能快速构建起实用性成果,这样的赋能效果令人惊叹。”
Buytaert建议,企业至少应该展示一下自己的开发流程,还有AI模型是如何得出答案的。“他们必须拿出诚意,这样才能消除关于AI模型吞噬网络流量和种种消极影响的争议。比如说,在提出问题并给出答案之后,我们应该知道AI为什么信任自己的来源,包括返回相应链接。”
这只是个开始,搜索引擎初创公司You.com已经开始在其聊天搜索引擎中开放相关功能。
虽然偏见的解决难度更高,但微软的Bajwa表示,在各方的共同努力下这也并非不可实现。“监管和督导是必须存在的。技术能起的作用只是一部分,最终还得在组织结构、流程和治理上下功夫,这也是生成式AI技术的起效位置。企业必须就具体使用方式设定相应的参数、建议和流程。”
只有合理解决这些问题,企业才能真正放心大胆地运用生成式AI。尽管前景广阔,但绝不能对其放任自流。虽然短期应用能快速见效,但一切优点的背后都蕴藏隐忧。考虑到技术本身尚不成熟,生成式AI最好能在人类的陪伴和照料下一路“健康成长”。