每家公司都有大量的数据,每家公司的业务数据都是一座金矿,从中提取洞察力和发挥数据价值一直都极具挑战性。随着AIGC的快速发展,以大模型为核心的复杂的人工智能模型和机器学习正在超越“数据驱动”,推动各行各业的创新。
以共商促共享、以善治促善智!在7月4日开幕的2024年世界人工智能大会,星环科技作为大会的战略合作伙伴,通过自己产品、技术、方案等,助力企业打造AI基础设施,处理、理解和生成包括文本、图像、视频等多个来源的数据,构建多模态行业大模型,加速AIGC落地。
星环科技大模型产品“无涯·问知”在WAIC会议期间正式面向公众开放服务。星环科技也特设了大模型体验区,让用户实际体验快速建立企业专属的知识库,实现财务报表分析解读、合同审核等业务应用。
1.从Data Infra到AI Infra,发力工具平台、模型和语料、数据要素研发
世界人工智能大会已成为撬动人工智能产业发展的关键杠杆。2024年世界人工智能大会暨人工智能全球治理高级别会议不仅是一场人工智能的盛宴,引领未来智能科技潮流,更是一次对未来的深刻思考,贡献人工智能全球治理的中国智慧。
星环科技创始人、CEO孙元浩在参加WAIC会议时表示,人工智能将继续向着更加智能化、通用化、自主化的方向发展,逐步解决可信性低、泛化性差、可解释性弱等诸多问题,从而实现更加广泛的应用场景和更加智能的服务。
星环科技提出“从Data Infra到AI Infra”的发展目标,就是要更有效地统一管理算力、语料、应用,更准确、快捷地处理、存储、检索海量多模数据和知识,为千行百业提供多样、专业的原生人工智能应用,为用户提供端到端的人工智能语料、模型和应用的开发和应用解决方案。
为此,星环科技要打通从人工智能基础设施建设,到大数据、人工智能等研发应用的完整链条,加速人工智能对产业赋能的节奏,实现从数据的语料化、知识化、要素化,到从数字化到数-智化的转变;赋能企业拥有的多种来源的多模语料,能够准确、高效地转换为高质量的专业领域知识,并且源源不断地支撑诸如专业知识库问答、业财数据分析、智能投研、设备预测性维护等丰富的使用场景和应用,让企业构筑知识壁垒,实现“人工智能+”业务的高效落地和矩阵式创新。
针对本届大会人工智能的全球治理和伦理这一话题,孙元浩介绍说,为了解决AI发展中的大模型中文语料治理等数据问题,大模型的安全可控的问题,以及垂类全流程安全可控问题等,星环科技加大工具平台研发,如在Sophon智能分析工具中推出大模型运营平台(Sophon LLMOps),提供了一站式的大模型基础平台。
同时加快模型和语料研发,如推出大模型"无涯",借助公司研发和行业经验,完整实现了大模型所需要的硬件选型,基础软件开发,语料采集、处理、治理,模型训练、微调、对齐,上层应用开发等多个步骤,形成了大语言模型在行业的落地与合规安全的方法和实践。
另外星环科技积极推进数据要素相关研发,数据要素流通平台Navier和数据安全管理平台Defensor等都已投入应用。
2.全系列AI Infra集中展示,助力企业人工智能创新
生成式人工智能正在重塑行业,为创新和增长开辟新的机会。任何延迟实施AI的企业都有可能错失新的效率提升。为此,企业基础设施需要随之升级,原有的基础设施需要升级到AI Infra。
在WAIC盛会上,星环科技携其全系列的AI Infra平台与工具集璀璨登场,向公众绽放其卓越风采与无尽魅力。
知识库建设已经变成企业的一项基础设施,所有的不同类型的数据都能进行存储与管理,能根据需要导入到知识库中。只要企业保有自己的知识库,就可以通过微调得到企业专属的大模型,就可以实现大模型可以随时选、随时换,而企业核心竞争力得到保护的目标。
星环科技知识平台就可以满足用户的这一需求,为企业提供一个全面、高效、智能的数据处理和知识管理解决方案。
TKH集成了从语料到模型再到应用的完整AI Infra工具集产品,可以实现企业内部所有资料知识化的目标,并且可以统管企业Al Infra算力、语料、模型和应用,助力企业打造安全可控AI Infra。
有了TKH的加持,企业拥有的多种来源的多模语料能够准确、高效地转换为高质量的专业领域知识,并且源源不断地支撑专业知识库问答、业财数据分析、智能投研、设备预测性维护等丰富的使用场景和应用,让企业构筑知识壁垒,实现“人工智能+”业务的落地和创新。
在行业大模型发展中,企业面临技术复杂、数据和算力稀缺、管理成本高等挑战。星环科技推出大模型运营平台Transwarp Sophon LLMOps,提供一站式企业级大模型生产及应用全流程开发工具链,助力企业完成从预训练到微调,到强化学习,到持续模型评估的全生命周期,让每个企业都能构建自己的专属大模型。
在本届WAIC上,星环科技作为“大模型语料数据联盟”的技术型成员,积极参与了以“语料筑基,智生时代”为主题的论坛,并共同发起了“语料生态服务大模型可持续发展倡议”,入围了论坛的语料风云榜。
有效和精确的AI模型需要在广泛的数据集上进行训练,高质量的大模型需要高质量的语料。语料质量决定了模型质量,高质量语料也是解决行业大模型幻觉、可信可控等核心落地难点的重要手段。
星环科技一站式多场景语料平台Transwarp Corpous Sudio(TCS),覆盖了语料获取、清洗、加工、治理、应用和管理的全生命周期,具有多种灵活的采集和构建方式,能分布式地高效处理海量语料。
全面、多维、精细、增强、资产等5大优势,让星环TCS成为一个功能全面、易用高效、安全可靠的语料开发利器,能够极大提升语料开发效率,助力企业或机构高质量地构建大模型及其应用。
3.行业大模型脱颖而出,无涯问知应用场景丰富多彩
在WAIC上,星环科技主办了“新质生产力:AI Infra构筑企业新动能”主题论坛,与会专家展望了AI基础设施建设趋势,探讨多模数据库、AI Infra等技术构建企业级与个人知识库,实现生产力变革。
同时,星环科技还在大会现场展示了众多大模型及其应用,星环科技的无涯大模型Infinity和无涯·问知无疑是其中明星,吸引现场观众纷纷来体验。
星环科技无涯大模型Infinity可为各行业定制自有大模型,提供意图理解、语义召回、数据处理和分析能力。基于无涯大模型,星环科技推出无涯·问知、无涯·问数、无涯·金融、无涯·工程等AI原生应用,可应用于金融、能源、制造、工程等领域。
无涯·问知In?nity Intelligence于WAIC期间正式面向公众开放服务,广大用户可以现场注册使用,体验前沿AI技术,拥有自己专属的智能助手,高效完成各项工作。
现场体验发现,无涯·问知应用场景丰富多彩!企业可以基于星环知识库TKH,建立企业自己知识库应用;当企业算力不足时,可以采用安装了无涯·问知的AIPC,以弥补AI算力不足问题;中小企业用户不用自己构建知识库,可以直接利用星环科技无涯·问知公有云服务;对于个人而言,可以利用AIPC和公有云服务,访问无涯·问知服务。
专为个人用户设计的大模型应用产品星环科技问知AI PC版体验区吸引众多热情的观众。问知AI PC版弥补了AI算力缺失,把AI带给更多人,极大丰富个人用户获取和应用知识的方式,提升工作效率和知识管理能力。
而无涯·问知AIPC版支持多种格式、不限长度的文件资料入库,包括常见的PDF、Word、Excel、PPT、邮件等,满足了用户多样化的需求。支持影、音、图、文等多模态数据和资料的“知识化”处理,以及相应的“语义化”查询和应用能力,用户不仅可以通过文字来获取知识,还可以通过图片、音频和视频等多种方式,使知识的获取和应用更加丰富多彩。
星环科技展区还展示智能业务分析洞察平台“无涯·问数”,自然语言提问的全场景数据探索、仪表盘快速生成、指标标签预定义等核心功能,因为具备查询结果可解释、分析探索灵活、分析场景可见等特点,深受企业观众的喜爱。
无涯·问数因为集合了大型语言模型(LLM)、人工智能(AI)和商业智能(BI)的能力,使得非专业用户也能通过自然语言轻松查询数据,为决策者和业务人员带来前所未有的数据分析体验,实现大模型驱动下的大数据分析。
4.打造新一代一站式多模型数字底座,助力企业数智化
随着AI模型变得越来越复杂,并开始处理文本、音频、图像和视频等各种类型数据,对快速数据处理的需求变得更加迫切。星环科技提供企业级多模态知识存储与服务,包括大数据与云平台、星环分布式交易型数据库Transwarp KunDB、分布式分析型数据库Transwarp ArgoDB等,助力企业打造新一代一站式多模型数字底座。
在WAIC上,星环科技大数据基础平台TDH和大数据云平台TDC历来都是明星产品。这次展示的TDH 9.4更是增加众多新特性,如多模基座加速AI分析;仓集资源隔离架构,在混合业务场景下依然保持极致性能;湖仓一体架构,大幅降低TCO;同份数据跑批查询与混合负载,实时备份强在线业务容灾;同时支持多模型存诸架构、大模型海量训练数据存储、多模型混合检索召回增强、Python生态等。
而星环大数据云平台TDC 5.0,将原来的多个TDH集群统一纳管,统管多个TDH集群,形成物理上分散、逻辑上统一的企业级一体化大数据平台。新优势包括包括多集群及其基础设施、多数据应用实例统一管理;跨多集群统一调度资源,均衡多个集群资源使用;跨集群共享存储组件,实现NoCopy的跨集群数据共享;隔离和控制资源配额,快速、灵活的为不同业务部门提供多租户的PaaS服务等。
引人瞩目的分布式向量数据库 Hippo 2.0可以实现百亿级向量存储,提供灵活索引支持、20倍内存成本下降和向量全文混合检索等特性。其混合检索技术,提供基于向量检索+全文检索以及稀疏向量+稠密向量两类混合检索方式,有效提升大模型召回的准确率。
星环分布式时序数据库TimeLyre 9.2集成关系模型、时序模型等,实现了多模时序分析,助力用户解锁数据深层价值。而分布式图数据库StellarDB 5.1实现了多模查询汇数据之湖,子图分析探未知之域,更稳定、更安全、更易用。
在国产化替代方面,星环科技两款分布式数据库引人瞩目。其中,分布式分析型数据库ArgoDB支持标准SQL语法,提供多模分析、实时数据处理、联邦计算、隐私计算、数据脱敏等能力,一站式满足OLAP分析,实时数仓、数据集市、湖仓集一体等场景。
分布式交易型数据库KunDB 4.0,高可用能力与Oracle兼容性提升,支持跨系统多租户部署。其中,深度兼容Oracle,高度兼容Oracle对象与语法,支持数据快速迁移;高可靠,基于Paxos协议的异地容灾能力,增强数据安全性保障;数据库多租户,支持多个应用共享一个数据库实例,能快速由集中式扩展成为分布式。
在现场,星环科技还展示了智慧能源、智慧金融、数字政府、智慧制造、智慧交通、智慧医疗等行业成果。通过为企业搭建数字化转型的数字底座,星环科技将AI技术深入到各个行业中,助力政府、金融、能源、交通、制造业等众多行业成功实现数字化转型和智能化升级。