8月10日,以“精耕数智,加快创新”为主题的2023网易数帆城市之旅(北京)在北京JW万豪酒店举行。网易数帆在会上发布了一款集前沿AIGC技术研发于一体的对话BI产品——有数ChatBI。网易数帆大数据产品线总经理余丽华表示,借助ChatBI的自然语言理解和专业数据分析能力,用户只能通过日常对话获得可信的数据,大大降低了数据消费门槛,使“人人使用数据,始终使用数据”的愿景成为现实。
低效分析渴望AIGC新动力
在数字时代,无论是产品研发、营销、财务管理还是客户服务,使用数据支持决策已成为企业的日常生活,对企业数据分析的需求急剧增加。以网易数帆客户为例,其月平均数据分析需求超过200,规划、运营、用户体验、QA等不同岗位提出了数量需求,临时或紧急运营相关需求占很高比例。然而,由于数据分析过程的专业性和分析人才的稀缺性,传统的数据分析既耗时又低效。
这种极度麻烦的情况一直持续到AIGC技术的发展,可以用于数据分析的ChatGPT产品聚集在一起。ChatGPT产品回答问题,速度非常快,与数据分析师对需求的反应不同,这让从业者看到了效率之光。
然而,余利华提出了一个灵魂问题:“人工智能助手可以立即回答你的数据问题,但你能相信他们吗?”
答案是否定的。首先,ChatGPT产品不是专门为数据分析而设计的,只擅长处理与自然语言和文本数据相关的任务。其次,即使是最先进的通用大型模型也很容易捏造事实,俗称“人工智能幻觉”
在过去的10个月里,网易数帆的一个重要问题就是在数据分析领域与这种幻觉对抗,打造一个可信的ChatBI。
网易数帆打造可信ChatBI四大秘诀
“人工智能幻觉”的产生是由于缺乏训练数据、文本和表达之间的编码和解码错误。可怕的是,人工智能不知道这是一种幻觉,很难仅仅通过Prompt(提示)来纠正它。网易数帆是怎么做到的?
余利华用20个字总结了网易数帆打造可信ChatBI的奥秘:需求可以理解,过程可以验证,用户可以干预,产品可以操作。
所谓的需求是可以理解的,是指为了弥补用户认知和复杂工具之间的门槛,提高准确性,在大模型语言理解能力的帮助下,首先进行需求分析,这样即使是完全不了解BI的用户也可以通过需求分析内容来判断系统的数量步骤是否正确。
该过程可以验证,即在大型NL2SQL能力的帮助下进行审查。为了提高NL2SQL的能力,网易数帆定制并优化了30多万种不同类型的问题和SQL。余丽华介绍,网易数帆优化的NL2SQL模型已达到GPT-3.5的水平。
用户可以对数据模型和查询条件进行干预,用户可以对数据模型或查询条件进行干预和调整。
产品可运营,即网易数帆为ChatBI产品构建了独特的运营反馈机制,用户可以反馈数据的准确性,管理员可以操作知识库、标记和优化badcase,从而提高数据的可靠性。
可信ChatBI创建新的数据分析范式
网易数帆产品人员通过大型连锁超市华北地区销售总监的日常数量演示了如何通过数字ChatBI自助获取可信数据的过程。
产品人员只需输入“我想看看今年上半年华北地区的月利润”。一些ChatBI立即给出结果,并用自然语言描述查询的逻辑和步骤。如果有专业人士掌握SQL,也可以点击“更多”按钮查看相应的SQL。如果逻辑错误,如果用户想查看上半年“订单日期”的数据,但人工智能筛选是“交货日期”,用户可以点击“修改查询条件”进行相应的校正,也可以修改更符合需求的图表样式,如通过折叠图可以更好地查看趋势。
当被问及利润增长的原因时,一些ChatBI通过图表给出了影响利润增长的主要因素和维度:“细分为小企业、办公用品类别、北京城市”是影响利润增长的核心维度。
与传统分析方法需要繁琐的步骤不同,ChatBI可以通过对话和点击获得可靠的结果,而ChatBI可以让非技术人员轻松获得数据和业务洞察力。余利华认为,这是一种新的数据分析范式,门槛更低,效率更高,更智能。
目前,网易公司已有多家ChatBI应用,涵盖了产品、运营、市场、金融等非技术人员。
AIGC+ BI的持续探索
当AIGC成为影响整个数智领域的核心技术时,网易数帆也在利用AIGC建立数智竞争力。余丽华透露,ChatBI是BI领域网易数帆的实践成果之一。在数据分析阶段之前的数据准备阶段,如数据建模和管理环节,以及后续的数据应用阶段,网易数帆也在积极探索各种产品与AIGC技术的融合,未来将实现更智能的数据能力,如自动生成ETL流程、报表自动生成、填表自动生成、数据分析结论和洞察力。
余利华说:“AIGC和BI的结合将改变整个数据服务模式。
目前,数据分析能力已成为企业的业务能力,企业的每个员工都需要借助数据分析来实现更多的价值。网易数帆以ChatBI为主导的新数据分析范式,将更好地帮助业务增长,实现数字智能化转型。