2024年,IT行业最热的话题是什么?
4月17日,笔者在美国Las Vegas举行的SAS innovate大会上,见证了一贯低调的全球数据分析和预测领域的领头羊SAS,从头到尾谈论GenAI和Quantum Computing!是的,你没听错,SAS将生成式AI和量子计算贯穿到全部的三天活动中。
应该说,作为最早一批在业务数据领域耕耘的数据分析和预测软件企业,SAS显然在人工智能领域拥有得天独厚的优势。但是SAS的优势并非互联网,也并非大语言模型(LLM),而是行业相关的数据分析预测和人工智能,借助SAS软件和特定行业的解决方案,助力组织将数据转化为值得信赖的决策。
这时候我们就要看今天的数据和过去的传统数据有什么不同,比如过去更多是结构化数据,今天包括文字、图像和视频这样的非结构化数据得以爆发式增长,必然改变传统数据分析的逻辑,也因此催生出生成式人工智能(Generative AI)这样的IT行业新热点。而SAS,无疑是热情拥抱了所以这些新的领域,甚至展示了SAS创新实验室近期在量子计算方面的初步研发成果,显示出了SAS的包容与活力,也显示出传统行业面临的新机遇。
我们知道,以传统反欺诈、反洗钱解决方案立足市场的SAS,在过去5年宣布过两个10亿美元投资计划,首先是5年前的10亿美元人工智能投资计划,云原生和AI加持的Viya显然是其核心成果之一;而后在去年推出了针对特定行业解决方案的新10亿美元投资计划。但所有这些,都没有如今在SAS innovate 2024大会现场,SAS CTO Bryan Harris心心念念的GenAI和Quantum Computing那样令笔者震撼。
SAS CTO Bryan Harris
什么是生成式AI?ChatGPT如今家喻户晓。当然生成式AI不仅仅是主打文本和语音生成的ChatGPT,还包括图像和视频这样的非结构化数据在真实世界的虚拟构建,譬如不久前面世的Sora这样的AI视频生成工具。然而我们知道,即便是GPT4,也存在相当多的幻觉和错误。这些,又如何能与严谨的行业应用相匹配呢?
Bryan Harris举了一个例子:一家全球消费品制造商利用Viya及其GenAI功能来优化仓储空间,分配入境货物,并根据产品需求比较“假设”场景。SAS通过动态更新SAS Visual Analytics仪表板,帮助开发了基于LLM的数字助理,使公司的供应链团队可以通过深入分析,轻松节省时间,并提高仓库空间的使用率。
另一个案例来自SAS innovate 2024大会现场,全球财富500强企业Georgia Pacific(简称GP)的AI高级总监Sam Coyne举例说,“当我们的制造设备或工艺出现挑战时,我们会利用传感器数据、业务规则、推荐系统和生成式AI来建议适当的下一个最佳行动并解决问题。”
GP是全球最大的木材加工商和卫生纸生产商之一,也是世界上最大的锯木商之一。GP竟然借助SAS DataMaker生成合成的原木图像数据来增强大语言模型训练,以提高GP所关心的精度,从而做出正确的决策,获得即时价值。GP还借助SAS Viya的流媒体分析和智能决策管理解决方案,扩展了LLM编排和制造业特定的GenAI助理来解决实时运营问题。
而在SAS的传统核心优势行业也有很多GenAI应用场景。比如银行的电话客服如何更好地以顾客满意的方式有效处理投诉?真实世界的最佳流程是客服了解顾客的痛点,并迅速给出解决方案。换句话说,当一个投诉电话进来时,客服需要能迅速跟上故事,而不需要让顾客再次重复叙述整个过程。显然,这就需要使用AI和自动化处理技术,并借助GenAI生成的回复,为人工客服提供相对合理的答复样本支持。
毫无疑问,有了GenAI的支持而不是替代工作,客服能力将大大增强,无论是处理效率和处理质量,好处都是显而易见的。
熟悉SAS的朋友都知道,SAS在过去几年中一直强调生产力、性能和信任这三个发展原则,并形成了SAS的优势所在。GenAI毫无疑问对生产力的提高起到了推动作用。
在Bryan Harris看来,Viya将GenAI模型无缝集成到SAS智能决策这样的决策工作流、AI/ML应用程序中,可以使得现有业务流程得到加速创新;使用内置工具创建验证LLM生命周期的工作流,包括模型风险管理,可加强治理;内置在Viya平台中的定量决策能力,对GenAI推理的成功至关重要,可形成更精确的决策。更重要的是,通过强大的数据质量措施支持用户隐私和安全,包括SAS Data Maker生成合成数据、数据最小化、匿名化和加密,使敏感信息得到保护。
可以说,SAS的生成式AI已经广泛存在于Viya和SAS Customer Intelligence 360等产品中,这显示出生成式AI的行业应用思路日趋广泛。
但对于大多数中小企业来说,AI在过去几年中的行业落地并不十分普及,这是因为无论是AI模型训练还是推理的成本都非常高昂。如何降低整个业界的AI使用成本,也是SAS在打造了云原生的Viya之后,重点考虑的问题之一。
为此,SAS创始人兼CEO Jim Goodnight博士在SAS innovate 2024大会上,亲自演示了SAS Viya通过Workbench来拥抱开源,支持Python等语言开发的AI模型,借助API快速将Python代码转换成SAS代码集成到Viya中,提速企业生产力。
SAS创始人兼CEO Jim Goodnight博士
此外,SAS Viya Copilot通过个人助理加速分析、业务和行业任务GenAI编排,让更多的普通员工能够应用数据分析功能。
更重要的是,SAS开始为行业用户提供量身定制的轻量级AI模型作为产品打包交付,来降低用户的AI落地部署开销,比如欺诈检测、供应链优化、实体管理、文档对话和医疗保健支付完整性等经行业验证的确定性人工智能模型。
实际上,SAS在这很多行业应用领域都有着非常好的算法优化,比如可视化文本分析,SAS在不采用GenAI计算的情况下,也有很好的轻量级模型算法立即找到关键术语。
SAS负责人工智能和分析的副总裁Udo Sglavo表示,与繁琐耗时的传统人工智能实施不同,SAS面向行业特定的轻量级模型是为快速集成而设计的,是对现有解决方案和SAS Viya平台产品的完美补充,为组织提供了灵活、及时和易于使用的人工智能,以应对行业挑战。
显然,无论是SAS Workbench,还是为行业用户提供量身定制的轻量级AI模型作为产品打包交付,都显著降低了客户的使用成本,便于SAS扩大市场足迹。
我们知道,一个好的数据分析来源于好的数据质量。但是今天的数据已经不再仅限于传统的结构化和非机构化数据。根据Gartner的预测,到2026年,世界上使用的40%的数据中,有60%将会是合成生成的。
这里面大部分会是ChatGPT、Sora这些生成式AI工具的贡献,当然SAS Data Maker也生成合成数据,其方法基本上是通过比较原始数据集里不同变量的分布以及生成的表中变量的分布来评估的,SAS提供了一个开箱即用的可视化工具和评估统计指标,允许用户立即检查、对比。
换句话说,未来的世界还将在目前数据爆发增长的趋势下,进一步加速增长。这时候,性能将成为海量数据分析的主要瓶颈之一。
正是基于这样的考量,SAS开始了量子计算在行业应用落地领域的实质性研发。“我们一直在探索量子计算和传统计算之间的混合计算架构。”Bryan Harris透露,“我们正在与世界顶级公司合作,用真正的量子计算机运行实际用例。”
比如化学模拟,因为量子计算机是从量子水平运行的,它们实际上可以用经典计算机无法模拟的方式模拟原子和分子的行为,因此在科学领域,量子计算可以缩短新材料的可持续性发现过程,比如在电动汽车电池领域需要的材料。另外在药物研究领域同样如此,量子计算可以用经典计算机无法模拟的方式探寻药物之间的相互作用,来降低新药研发的时间和成本。
在SAS innovate 2024第一天和第三天的主题演讲中,SAS都花费了大量的篇幅,重点演示了从传统超算向量子计算进行实验探索的行业应用场景。
用大白话来解释,传统计算机处理数据都是靠芯片中晶体管的“开关”来实现,1代表“开”,0代表“关”。这就意味着同一时间,一个比特位只能表示1或0。但是量子计算的核心在于量子比特(qubit)可处于叠加态,可同时拥有“0”态和“1”态。例如氢原子中电子的基态和第1激发态、质子自旋在任意方向的+1/ 2分量和-1/2分量、圆偏振光的左旋和右旋等——两个量子比特可以同时表示00、01、10、11,信息量一下翻了4倍。
有了并行方式的量子计算,密码分析、气象预报、石油勘探、药物设计等需要大规模计算的领域都会有飞跃式发展。这些计算在谷歌实验室中把超级计算机需要2.5天完成的任务,通过量子计算只花了3分20秒!
实际上在模型优化方面,量子计算也可以比传统计算更有效地解决复杂问题。比如经典的推销员旅行线路问题,如何尽量减少旅行的总距离。传统上是一个串行试错问题,但是基于量子计算会让这个过程变成了并行搜索整个空间,从而大幅提升效率。
根据第三方数据,过去几年中SAS在性能方面的努力,已经使Viya的性能速度30倍于其它开源和商业产品,49倍于其它商业数据和AI平台,326倍于其它商业数据和AI平台的模型开发效率。然而,在未来可期的量子计算环境下,这一性能还将获得重大突破。
显然,无论是生产力还是性能,都是SAS本次大会的突出重点。除此之外,信任,在SAS看来,则是另一个数据相关的核心要素。有调研数据显示,目前只有十分之一的组织拥有可靠的系统来衡量LLM中的偏见和隐私风险。而SAS希望,通过致力于治理框架和增强对数据使用的信任,来让市场实现数据更广泛的法规遵从性。
通过这三天的SAS innovate 2024大会,应该说今天的SAS基于Viya在WorkBench开源编程转化、DataMaker合成数据、Copilot数字助理、产品化轻量级行业模型、生成式AI和量子计算领域都实现了生产力和性能上的突破。未来的SAS,正在Builders of AI,Buyers of Solutions,Subscribers of Models的道路上,乘风破浪、越走越远。
文/余文
《科技看门道》坚持深度报道,希望能通过资深媒体人对IT产业热点新闻的深入思考,挖掘其背后的商业逻辑和创新模式——不仅看热闹,更要看门道!
《科技看门道》主笔在行业渠道媒体拥有20余年的从业经历,不仅对IT消费类和企业级软件、硬件、云计算、大数据、人工智能、区块链均有较深入的理解,同时见证了中国IT产业链上下游合作生态圈包括分销、零售、SI、ISV和CSV的进化历程,见证了金融、能源、制造、医疗、教育、政府、零售、高科技等行业的信息化和数字化转型之路。
《科技看门道》相信,IT产业在供给侧的改革——包括云计算、大数据、移动互联、人工智能、区块链等,将会成为推动各行各业“新质生产力”发展进步的核心力量。