通信世界网消息(CWW)从“百模大战”到“千模大战”,全球通用大模型数量快速增加,并不断升级迭代,但却不能完全适应企业AI应用需求。
“现在每个大模型应用开发都要很久,重复训练量很大。我们想把整套AI基础设施建好,用户再在大模型上开发应用就快了。”星环科技创始人、CEO孙元浩在2024向星力·未来数据技术峰会上表示,大模型技术已快速融入企业生产经营的方方面面,在企业生产效率提升、业务职能提效和行业应用场景创新中无处不在,不但重构产业,打造企业的核心竞争力,而且成为企业的基础设施和核心能力,助力企业打造新质生产力。
在大模型时代,企业数据如何变现?如何快速建立行业大模型,使用AIGC?致力于改写数据交互方式的星环科技给出了答案——AI Infra。
全面战略升级,从Data Infra到AI Infra
从最早的“Data Hub”到“Data Cloud”数据云,从“Unified Data Cloud”融合数据云到Data Infra(数据基础设施),星环科技总能站在数据分析模式演变的最前沿,并根据数据的变化和客户需求的升级推出“与时俱进”的全新理念和解决方案。
如今,人工智能大模型正在催生新一轮技术创新与产业变革,星环科技也嗅到了新的商业机遇。
当前市场以通用基础大模型为主,通识能力强,但缺少行业专业知识。将大模型融入千行百业,让企业的AI应用从早期直接调用通用大模型,发展到建立自己的AI基础设施,打造行业或特定领域、任务的专用大模型,助力生产力革新和产业升级,已经成为目前企业关注的核心。
孙元浩表示,星环科技的定位从Data Infra进一步延伸到AI Infra,为企业客户打造AI基础设施,打造从语料处理、模型训练、知识库建设等的一整套的工具链,帮助企业快速建立行业大模型,快速使用AIGC。
从需求上看,目前,通用大模型数量快速增加,并不断升级迭代、提质增效,但是却不能适应企业AI应用的需求。而另一方面,企业对行业大模型需求增加,迫切需要降低使用门槛,更加普惠地使用大模型、生成式AI技术,以解决企业内部人才、算力、数据等不足的挑战。将AGI限制在一个特定领域或者一个行业或者特定任务,不断提升模型准确度,成为一条切实可行的发展途径。
在技术上,生成式AI出现后,深度学习出现了一个重大变化,从以前的可能几千万、上亿的样本数量的大样本机器学习,演变成现在小样本机器学习,让行业大模型应用范围变得更很广,让模型能够思考、学习,能够理解自然语言,能够完成更多的工作。
星环科技认为,企业需要自身的AI Infra,打造行业大模型,赋能企业更快、更容易地使用大模型,释放数据价值。
针对企业的AI Infra建设,星环科技通过自主研发,可以向用户提供一站式企业级大模型生产及应用全流程开发工具链,让大模型快速落地。星环科技拥有从语料到模型再到应用的完整的 AI Infra工具集,覆盖语料开发和管理、大模型训练与持续提升、多模态知识工程、多模知识存储与服务、原生AI应用构建编排和应用服务等重要阶段,提供提示词工程、检索增强、智能体构建等大模型应用快速构建和提升、模型推理优化、模型安全和持续提升技术。
通过星环科技AI Infra工具,企业能够准确、高效地将拥有的多种来源的多模语料转换为高质量的专业领域知识,并且源源不断地支撑专业知识库问答、业财数据分析、智能投研、设备预测性维护等丰富的使用场景和应用,让企业构筑知识壁垒,实现“人工智能+”业务的落地和创新。
星环科技AI Infra工具支持异构算力、语料、知识、大模型应用的统一管理,为数据和语料资产的集约化提供了一站式平台,且具备企业级的组织空间管理能力。
未来,星环科技通过自主研发,不断完善AI从基础设施到应用的产业链条,可以为客户提供端到端的全套AI解决方案。
开启个人大模型应用新篇章
生成式人工智能(AIGC)爆火后,科技驱动的前置条件已被满足,在业内,行业大模型结合知识库正在从超越常人平均水平的L2阶段向超越90%常人的L3阶段进发,这让几何级“智能涌现”成为可能。
据了解,星环科技从2022年底开始大规模投入研发的大模型相关产品——星环知识平台Transwarp Knowledge Hub(TKH),星环的知识平台TKH包括知识存储与服务、语料开发与知识构建、大模型基础服务等几个重要部分。
TKH星环知识平台基于无涯大模型打造了无涯·问知、无涯·问数等知识应用,一年前“无涯”还只是金融领域的特长生,如今已经广泛应用于金融、能源、制造、工程等多个领域,通过精准的数据分析和知识管理,满足企业不同类型的知识应用需求,从而提升企业业务效率和竞争力。
星环科技宣布推出问知AIPC版,这是一款专为个人用户设计的大模型应用产品,标志着个人智能应用时代的全面展开。
问知AIPC版是星环科技基于其先进的大模型技术,可以在配备Intel新一代CPU的主流个人电脑上,基于集成显卡和NPU流畅运行。它不仅具备强大的本地化向量库,支持多格式、不限长度的文件资料入库,还支持影、音、图、文等多模态数据的“知识化”处理,以及“语义化”查询和应用能力。这款产品的推出,使得用户能够通过多种方式获取和应用知识,极大地丰富了知识的获取和应用场景。
星环科技的问知AIPC版展现了显著特性:
首先,它具备泛行业的知识获取能力。无论在日常使用还是特定行业应用中,无涯大模型AIPC版都能充分发挥大模型技术的优势,为各类场景提供强大的支持。
其次,该版本提供了出色的内容理解能力。这包括对感知和认知层面的深度理解,以及对事实、流程、图谱等高级语意的精准把握。这种能力使得无涯大模型AIPC版能够更准确地理解用户需求,从而提供更精准的服务。
最后,它还具备强大的数据分析能力。对于可量化的内容,无涯大模型AIPC版能够提供高效的计算和分析能力,帮助用户从海量数据中提取有价值的信息。技术峰会现场,英特尔中国软件技术合作事业部总经理唐炯表示, AI的世界30%是靠硬件,70%靠的是软件,英特尔不仅提供了强大的硬件平台,还构建了全面的软件工具链,和星环科技这样的伙伴合作,提供最佳的AIPC产品和体验。
星环科技与英特尔的合作不仅为市场注入了新的活力,也引领了行业向更加智能化和个性化的新时代迈进。
孙元浩表示:“问知AIPC版的推出,是我们对智能PC技术不断探索和创新的结果。我们相信,这款产品将极大地提升用户的工作效率和知识管理能力,同时也将推动社会进步和经济发展。”
Data Infra持续深化,星环系列产品推陈出新
星环科技在推出全新的AI Infra的同时,不断完善Data Infra产品与服务。
星环大数据云平台推出TDC 5.0,将原来的多个TDH集群统一纳管,统管多个TDH集群,形成物理上分散、逻辑上统一的企业级一体化大数据平台。TDC 5.0具有独特的优势,包括多集群及其基础设施、多数据应用实例统一管理;跨多集群统一调度资源,均衡多个集群资源使用;跨集群共享存储组件,实现NoCopy的跨集群数据共享;隔离和控制资源配额,快速、灵活的为不同业务部门提供多租户的PaaS服务。
星环科技推出了分布式交易型数据库KunDB 4.0,高可用能力与Oracle兼容性提升,支持跨系统多租户部署。其中,深度兼容Oracle,高度兼容Oracle对象与语法,支持数据快速迁移;高可靠,基于Paxos协议的异地容灾能力,增强数据安全性保障;数据库多租户,支持多个应用共享一个数据库实例,能快速由集中式扩展成为分布式。
星环大数据开发工具TDS 4.0,增加了数据实时同步、数据入湖向导、智能化数据资产盘点、数据资产门户、数据服务编排等功能。
星环大数据安全与隐私保护工具软件Transwarp Defensor是星环科技自主研发的大数据安全与隐私保护安全管理平台,致力于帮助企业建设以数据为中心的数据安全防护体系,包括了解内部敏感数据分布情况,帮助管理者发现潜在风险,监管重要数据的合规合理使用等。Transwarp Defensor 提供数据分类分级管理、数据脱敏、个人信息去标识化、数据访问控制、敏感资产风险评估等基础能力,能够做到事前发现,事中防护,事后溯源,帮助企业有效建立数据安全防护体系。Transwarp Defensor 4.5,增加了大模型核心资产识别、数据资产流转链路监控、安全策略智能推荐,安全风险预警与应急响应。
星环数据要素流通平台Transwarp Navier通过提供隐私计算环境,使得数据供需双方可以进行安全的数据交易。而Transwarp Navier 3.1则新增了全链路智能合约确保安全合规、数据流通全链路行为监控与分析、实时告警与阻断等。
不吝啬于对技术创新的投入,不断创新数据落地的新模式,同时始终坚持自主研发和自主创新的战略定力,是星环科技在全球和中国数据服务市场闯出一片新蓝海的关键所在。从语料到模型再到应用的完整的 AI Infra 工具集,星环科技将为更多企业构筑知识壁垒,赢得行业竞争力,实现“人工智能+”业务的落地和创新。