在大模型和生成式AI的喧嚣中,老牌数据分析公司、数据分析之王SAS公司,保持了冷静的姿态。2023年,SAS公司宣布在未来三年向行业AI解决方案领域投资10亿美元,这些投资将显著提升各行业的企业AI生产力。在SAS公司看来,大模型与生成式AI看似“热辣滚烫”,但在提升企业生产力方面,仍然无法取代预测分析、高级分析等传统商业分析。
在2024年4月的SAS Innovate 2024大会上,SAS公司的数据科学家及产品营销主管Spiros Potamitis打了个形象的比喻:就像今天广为流行的自行车、摩托车和汽车,实际上源于1800年代的设计,而这些设计在过去的200多年间并没有根本性的变化,原因在于初始设计目的和用户需求并没有发生明显变化。
类比用于商业分析的各种预测分析和高级分析算法,实际上这些算法的初始设计目的和用户需求也没有发生明显变化,大模型与生成式AI只是提供了更为友好的交互界面,让预测分析和高级分析等更为普及、更高效生成代码、更容易找到匹配算法、更可解释等。换言之,大模型和生成式AI让商业分析的“江山”更巩固。
SAS公司在2023年实现了8%的总体销售增长,其中解决方案销售增长了9%、云销售增长了30%、SAS Viya销售增长了30%,90%的财富100强或其关联公司选择了SAS,35份行业分析报告将SAS列为AI、分析、客户洞察、风险管理、反欺诈和安全智能等领域的领导者。
在2024 SAS Innovate大会上,SAS突出了生成式AI、量子计算等热点话题,但核心依然是能真正创造商业价值的预测分析与高级分析等算法——这才是商业生产力“本源”。
LLM大模型被视为通用AI,这非常容易让人迷惑,以为大模型无所不能,将取代之前所有的各种算法。通用AI的意义在于它能替代人类的认知和思考等智慧能力,包括知识学习、表达、推理、内容生成、任务规划与执行、自然语言沟通等等。当然,目前距离机器全面取代人类的智慧能力还很远,但大模型为这一天的到来,奠定了扎扎实实的基础。
而传统商业分析所运用到的预测分析和高级分析等,主要包括时间序列指数平滑模型、自回归模型、UCM未观测组件模型等统计学模型以及机器学习模型和深度学习模型等。这些源于统计学和高等数学等算法,像统计学已经存在了超过200年,机器学习和深度学习也有近70年的历史,其它经常用于商业分析的优化与运筹学也有至少80年的历史。
这些经典算法是人类对于世界规律的抽象认知,远远超出了大模型的能力范围。这些经典算法,不论是过去、现在还是未来,都有着巨大的商业价值。麦肯锡在2022年估计全球每年有价值6000亿美元的食物被浪费,占全球粮食总产量的30%-40%。在资源短缺、供应链中断、消费者需求突变的今天,能够及时预测未来趋势变得愈加重要。另外,预测的准确性也变得更为重要,麦肯锡在2018年的一份调查发现,在大众消费品行业,将预测准确度提高10-20%,就能带来5%的库存成本节省和2%-3%的营收增长。
那么LLM大模型对于预测分析等商业分析有什么价值呢?Spiros Potamitis等SAS公司数据科学家们认为,LLM大模型在代码生成、用户交互、智能建议、可解释以及自动化等方面,给商业分析带来重大价值。简单理解,LLM大模型让人们能够以自然语言的方式与软件“交流”,这样就能够轻松地与诸如预测软件等“沟通”分析需求、对比不同参数的分析结果、获得洞察和智能建议等,而智能建议将包括推荐合适的模型、调整参数、处理缺失数据、应对异常等。
这就是在SAS Innovate 2024上所展示的SAS Viya Copilots愿景。在SAS Innovate 2024上发布了SAS Viya Copilots的第一批成果:为开发人员、数据科学家和业务人员提供加速分析、业务和行业任务的个人助理,提供的工具有代码生成、数据清洗、数据探索、市场规划、消费者旅程设计和知识鸿沟分析等。
例如:在代码生成示例中,开发者可以向SAS Viya Copilot提出要求,针对现有数据源建议适合的建模和分析方法,Copilot随即提供8种建模和分析方法并逐一解释每一种方法;此外,开发者可以在无代码和有代码的编程体验之间无缝切换,既可通过Copilot直接生成结果,也可以查看详细的代码;面向行业,SAS提供了智慧执法Copilot、风险和欺诈Copilot、健康和生命科学Copilot、客户洞察360 Copilot以及物联网Copilot等行业Copilot,行业用户将Copilot嵌入端到端的业务场景中,用户提出分析需求,Copilot调用相关的算法,返回相应的结果并进行对比,从而普及商业分析、高效辅助决策。
当然,SAS Viya还支持将SAS Viya的能力与用户的大模型堆栈技术组合起来,形成完整的企业大模型应用。例如,将LangChain、LlamaIndex、Guardrails、pgvector、Airflow、Hugging Face等开源大模型工具与SAS Viya平台的能力组合起来,将大模型嵌入到现有的企业业务流程和系统中,覆盖端到端的完整的企业应用场景。
根据DataIntelo的2024全球商业分析市场报告,2023年全球商业分析市场规模达到441亿美元,到2032年将达到959亿美元,2024年到2032年的年复合增长率达到9%。在全球经济动荡的阶段,由预测分析、人工智能和机器学习等所组成的商业分析市场,正在迎来增长的黄金期,而其背后有着大模型和生成式AI的强大推动力。
SAS Viya是新一代SAS公司的数据分析和AI平台,SAS公司持续投资Viya平台——不断提高Viya平台的生产力,同时将Viya扩散到更多的基础IT平台之上,让商业分析的能力无处不在。作为数据分析“之王”,SAS公司对于Viya平台的持续投资告诉我们,虽然大模型与生成式AI还不能带来显著投资回报,但却在切实拉动商业分析的市场。
在SAS Innovate 2024上,SAS公司介绍了几个重要的SaaS方案,围绕SAS Viya平台和AI及LLM能力,进一步巩固了SAS公司的商业分析“帝国”。其中,就包括SAS Workbench、SAS Models和SAS App Factory等三大“杀招”。
SAS Workbench是一个按需调用的分析环境,可帮助数据科学家、开发者和程序员,使用自己所熟悉的编程语言环境——包括SAS、Python和R,快速进行分析、构建模型。SAS Workbench让开发者在诸如微软Visual Studio Code这样的开发环境中,可以“召唤”出按需服务、自助配置和自动终止的SAS Viya分析功能,例如可配置定制化的CPU/GPU算力以满足分析需求等。SAS Viya Workbench支持结构化数据和图形图像数据,还可以调用SAS的生成式AI能力,用于解释或生成代码。今年第二季度,Viya Workbench将在亚马逊云Marketplace首次上线,未来将上架更多云服务商,以SaaS软件的形式将SAS Viya“嵌入”到更多用户所熟悉的开发环境中。
SAS Models是迄今为止SAS公司最重要的创新之一,也为SAS公司设立了一个新的业务方向。作为去年10亿美金投资承诺的成果之一,SAS Models将SAS的咨询能力、数据处理能和算法构建等端到端的能力打包成软件,让用户无需精深的知识或技能,或在没有更多时间和精力的情况下,就能从零开始构建复杂的行业AI模型,例如供应链优化、金融欺诈侦测、医疗支付一致性检测等。
SAS App Factory是SAS公司在2023年底发布的AI云应用快速开发SaaS环境,该环境支持数据科学家和前端应用开发者的协作,同时支持标准的基于UI的应用开发和迭代工作流。SAS App Factory在React、TypeScript等前端应用开发框架和Postgres云原生数据库等之上,自动化安装和集成SAS云原生技术堆栈,从而简化AI模型植入云原生应用的过程。
简单理解,SAS Workbench、SAS Models和SAS App Factory都是将SAS Viya的核心能力和AI能力打包成不同的SaaS软件,再快速嵌入到开发者所熟悉的开发环境、现有应用或云原生应用中,极大提升应用程序的分析能力和AI能力,也极大释放了开发者的生产力。IDC认为,这些SaaS产品还将进一步面向原生Python和R开发者打开SAS生态,从而赋能下一代数据科学家。
在SAS Innovate 2024的主题演讲中,SAS公司EVP及CTO Bryan Harris表示,量子计算一直是SAS公司的研发前沿,“而我们现在距离应用量子计算,就像今天LLM大模型对生成式AI的影响,也就仅仅一到两年之遥。”Bryan强调,SAS公司正在研究量子计算与传统计算所组成的混合计算架构,而且已经取得了实质性进展。基于现有的量子计算机,SAS公司正与世界一流公司一起,研究用量子计算解决他们最棘手的问题,已经获得了突破性进展。
在过去的几年,业界一直在炒作量子计算,但实际上很难打造出真正的可规模化商用的量子计算机。我们知道,一个量子比特具备叠加态,即可以同时代表“0”或“1”或“0”与“1”等状态,这让量子计算能够同时搜索所有的可能性空间,而不像传统计算机那样只能顺序搜索。而量子纠缠让量子比特之间相互关联,每一个量子比特的状态都会影响另一个量子比特的状态,这将极大增强计算力。
SAS公司认为,量子计算将重新定义数据分析和AI模型训练,量子计算机处理AI算法的效率要远高于传统计算机,同时需要更少的数据,这些都将让AI以今天所无法想象的方式进行学习和适应。当然,今天还无法建造出能商用的量子计算机,也无法用现有的计算机对量子计算进行完整模拟,但将量子计算模式与传统计算模式结合起来,则将有可能产生真正有意义的结果。Bryan Harris强调,就像GPU与CPU的混合架构,能够解决LLM大模型计算的诸多问题,量子计算与传统计算的混合架构,也能够在当下就创造商业价值。
目前主要有两种量子计算的类型:量子退火和门模型。SAS公司在将量子退火用于优化问题、将门模型用于量子AI、量子机器学习、量子化学和量子模拟等问题方面,进行了大量的研究工作。通过将量子计算与AI融合起来,能够解决之前所难以解决的问题,例如大规模海水淡化、清洁能源和用于欺诈防护的量子加密。
在商业领域,SAS公司目前正探索将量子计算用于四大行业机会:药物发现、金融建模、化学仿真和优化问题。
在药物发现方面,量子计算能够准确模拟分子行为,显著降低发现新药物的时间和成本。在金融建模方面,今天的物理世界正以数字方式紧密连接起来,量子计算能够改进金融市场、风险评估和产品优化等建模问题。在化学仿真方面,量子计算能够准确模拟原子和分子在量子级别的行为,这将颠覆传统的化学领域,包括发现新物质、改进可持续性,并在电池等领域产生重大突破。在优化问题方面,量子计算能够处理复杂的优化问题,如经典的旅行推销员路线优化问题,要比传统计算更加高效。
专家们认为混合量子计算将极大增强未来的计算机处理能力,量子处理单元(QPU)的出现将处理经典CPU和GPU之外的计算任务。尽管GPU在并行计算方面已经具有很强的能力,但将高度并行化计算任务处理交给QPU,则更为高效。换言之,QPU将处理CPU和GPU都不能解决的计算任务。
有了正确的混合计算架构,不必等待量子计算机和量子技术的完善与成熟,就注定能够实现历史性突破性创新。例如,科学家们相信二进制/量子的组合,将终结对蛋白质折叠问题的50年征途,将为癌症、阿尔兹海默症、帕金森症等疾病带来深远影响。Gartner分析师也认为,我们正走向量子计算与AI的无所不在和极具影响力的时代,量子计算与AI将像智能手机那样颠覆性解决问题和进行创新。
总结而言:SAS Innovate 2024是一个具有里程碑意义的大会,本次大会向业界宣告了LLM大模型和生成式AI固然“热辣滚烫”,但传统的商业分析才是“钻石恒久远”。LLM大模型在定量分析等商业分析领域远远比不上传统的分析算法,LLM大模型虽然能带来个人生产力的极大提升,但在由商业分析所统治的商业生产力领域则表现非常糟糕。这为SAS公司带来了长久生存之道,那就是打造可以存活200年的商业分析工具,就像自行车、摩托车和汽车那样。而今天的SAS公司正处于一个前所未有的好时机——各大企业都在减少供应商的数量,从而收缩到几个供应商的战略组合,这就让SAS有机会接触到客户的更多场景,这就意味着商业分析的黄金时代,才刚刚开始!(文/宁川)