出品 | 搜狐科技
作者 | 尹莉娜
ChatGPT的热度持续高涨,在收获人们惊叹的同时,关于ChatGPT到底是玩具还是工具的讨论也在不断发酵。
一方面,ChatGPT的靠谱性已经在代写论文、修改代码、查询法律、完成作业等高脑力劳动上有了切实体现,工具属性极强。但另一方面,ChatGPT却经常因“胡编乱造”被世人指摘,被调侃只是玩具。
“ChatGPT文本生成已经具备高完整度,更加‘组织化’。体验已经到达了一个阈值、一个令人惊艳的水平。”
但由于在中间层缺少垂直的产业知识和领域知识,ChatGPT在忠实度、可信度、精准度方面还存在一些不足。”京东集团副总裁、IEEE Fellow何晓冬博士对搜狐科技表示。
ChatGPT之所以取得了不错的效果,何晓冬博士认为,一部分归功于技术路线的修正和选择。“ChatGPT创新性地使用了半监督学习算法。如果没有人的数据甄选,这个模型参数即便大十几倍,也很难达到这个效果,某种意义上,这其实是对过去一味追求(参数)大和追求无监督学习的一个路线修正。”
关于类ChatGPT产品未来的发展方向,何晓冬认为,为了提升生成内容的真实性和准确度,增强其工具属性,「产业版ChatGPT」是更适配企业的发展路径。
近期,京东也顺势发布了类似产品言犀大规模预训练语言模型。2月12日,京东云旗下言犀人工智能应用平台宣布,整合过往产业实践和技术积累,将推出“产业版”ChatGPT——言犀大规模预训练语言模型,并公布落地应用路线图“125”落地计划。
计划背后,包括一个参数量达千亿级的智能人机对话平台,在零售、金融两个领域的知识体系背景,以及内容生成、人机对话、用户意图理解、信息抽取、情感分类等5个方面的应用。
举例来说,在京东最为擅长的电商领域,言犀商品文案生成模型已经覆盖了京东的3000多个三级品类,累计生成文案30亿字,应用于京东发现好货频道、搭配购、AI直播带货等,累计带来超过3亿元GMV。
除了目前已知的应用之外,何晓冬博士认为,类ChatGPT产品将在客服、媒体、电商、影视、娱乐等数字化程度高、内容需求丰富的行业中大有可为。“生成式AI或成为重要内容生产基础设施。“
不过,在承担工具属性的同时,成本也就成为了不得不考虑的问题。在商业应用角度,随着对数据库体量、反应速度、专业化程度等等方面的要求逐步提升,成本的进一步提高恐怕也是无法避免的。未来如果想要大规模应用,成本仍需大幅优化。
以下为搜狐科技就ChatGPT技术问题与何晓冬博士的对话精编:
1、搜狐科技:如何评价ChatGPT这款产品的优劣势?
何晓冬博士:ChatGPT是第一款真正意义上的AI原生的产品,最大的创新在于文本内容生成,并可以通过多轮交互式对话,来逐步理清用户的意图,尤其是一些比较复杂的意图,并给出相应的回答。整个交互体验流畅度非常好,再配合ChatGPT文本生成的高完整度,更加“组织化”,体验就到达了一个阈值、一个令人惊艳的水平。
从技术角度上,相较于之前大量使用无监督深度学习算法,ChatGPT模型背后的算法和训练过程更加新颖,创新性地使用了半监督学习算法。如果没有人的数据甄选,这个模型参数即便大十几倍,也很难达到这个效果,某种意义上,这其实是对过去一味追求(参数)大和追求无监督学习的一个路线修正。
不过,尽管ChatGPT在通用性方面已经展现出强大的能力,但作为服务具体产业场景而言,由于在中间层缺少垂直的产业知识和领域知识,在忠实度、可信度、精准度方面还存在一些不足。
2、搜狐科技:类ChatGPT产品的打造有哪些门槛?
何晓冬博士:需要众多的技术积累,包括需要大量的数据集和算力。类ChatGPT产品的经济性具有一定门槛。除技术要求高外,大规模预训练语言模型的训练成本非常高昂,需要大量的数据集和算力。
在商业应用角度,随着对数据库体量、反应速度、专业化程度等等方面的要求逐步提升,成本的进一步提高恐怕也是无法避免的。未来如果想要大规模应用,成本仍需大幅的优化。
当前,类ChatGPT产品主要依赖于对话式AI、生成式AI、预训练语言模型等核心技术,相关衍生产品在客服、电商等领域已有广泛的落地应用,其对于相关企业全栈AI、AI工程化能力均带有较高的要求。
3、搜狐科技:京东过去在ChatGPT等相关领域有哪些投入和成果?
何晓冬博士:京东有良好的土壤培育产业AI以及服务AIGC的产业化。自从2017年转型以来,京东累计投入了900亿元,拥有10余年任务型智能对话经验的积累。目前,京东云言犀已服务京东域内外超5.8亿用户,为数十万商家提供智能咨询与导购服务。
从应用角度说,京东云在基础技术和产业应用上有深厚的积累,累计服务了京东域内外5.8亿用户,超过数十万商家,山西大同、广东东莞等多地等政务服务热线也使用了我们的对话式AI技术来服务广大市民。