当前位置:首页|资讯|AI大模型

【AI大模型展】达观垂直大模型——更懂业务的大模型

作者:数据猿发布时间:2024-07-19

达观垂直大模型

该AI大模型由达观数据投递并参与数据猿与上海大数据联盟联合推出的《2024中国数智产业AI大模型先锋企业》榜单/奖项”评选。

达观数据的垂直大模型是一款国产大型语言模型,专为垂直领域定制。通过并联多种模型,支持专业文档写作、知识检索、知识问答、文档审核等场景。拥有高质量行业数据混合增量预训练构建强大垂域基座,拥有文档审阅、知识增强检索、专业写作、资讯解读、对话分析5大类100+细分场景沉淀指令数据,通过通用指令、NLP指令、垂直领域指令微调激活大模型专业场景应用处理能力,成为更懂实际业务的大模型。目前已通过国家网信办第三批生成式人工智能服务备案。

应用场景/使用群体

应用场景一:知识库高级应用

达观新一代智能知识管理系统(KMS)以自主研发的“曹植”大语言模型为核心,融合了知识图谱、自然语言处理、多模态知识挖掘等尖端AI技术。该系统具备知识生产、组织、搜索、问答、图谱构建和社区管理六大功能,能够将企业积累的大量结构化和非结构化文档通过先进的自然语言技术进行处理和提炼,构建一个更加智能化和人性化的知识管理体系。这一系统将广泛应用于企业文档管理、研发知识管理、制度管理和合同管理等多个场景,助力企业用户实现知识的快速获取、高效共享、便捷应用和持续创新。

应用场景二:数字员工

无论是在企业内部流程优化,还是在客户服务改善方面,数字员工都具备惊人的潜力。例如,在知识检索与整合智能的场景中,达观Agent可以通过访问和理解海量的知识库,为用户提供准确的信息检索和整合服务,支持决策和问题解决。在财务与会计的日常业务中,达观Agent够自动执行财务数据录入、账目核对和报表生成等任务,简化财务流程。在面对客户服务和支持方面,达观Agent可以用于在线客服和支持系统,处理常见问题并提供实时帮助,同时还能够学习和优化以应对更加复杂的需求。达观Agent还可以提供个性化的培训建议和学习路径,帮助员工提升技能和职业发展,助理企业员工的培训与发展。同时在员工招聘方面,智能数字员工可以筛选简历、安排面试日程,提高招聘流程的效率和精度等。

产品功能

达观垂直大模型主要根据客户的知识库系统和特定的文本处理场景部署,主要服务场景和功能如下:

数据库问答:

达观智能知识库问答针对企业内部知识库的内容进行解答,实现更智能更精准获取专家级知识。

知识库问答:

达观智能知识库问答,智能开发自然语言转SQL语言技术,充分利用大模型的能力,为企业提供自助式数据库智能查询服务。

垂直文本写作:

达观智能知识库支持智能文本写作,可满足企业日益增长的个性化和专业文档写作需求,例如标书、债券募集书、审计报告、企业运营周报等。

智能审核:

达观智能知识库基于大模型能力,例如,可自动审核招股书是否满足相关外规内规文件的要求,审核点主要包括了披露内容的全面性,以及基础核查项。

达观Agent:

达观智能数字员工巧妙地融合了机器人流程自动化(RPA)的高效执行能力和“曹植大模型”的先进语义理解技术。RPA作为数字员工的执行核心,自动化处理重复性任务,而曹植大模型则赋予其理解复杂语言和任务规划的能力,使得数字员工能够精准捕捉并响应用户需求。此外,通过知识管理系统,数字员工能够存储和利用历史数据,优化任务执行策略。这种结合不仅提升了企业运营的效率,还可推动业务流程的智能化和自动化。

产品优势

达观垂直大模型是“混合模型+垂直知识+场景应用”,它兼容了多种基座模型,不仅有自有的“曹植”大模型以及第三方基座模型如百川、智谱、Llama等,方便兼容并包、实用性强。"曹植"大模型以其在长文本处理领域的专业能力而闻名。它擅长长文档的写作、审核、润色和翻译,能够自动完成多类型、复杂结构的长文本创作。无论是撰写白皮书、技术报告还是品牌故事,曹植大模型都能提供流畅、高质量的文案服务。同时,它还积累了丰富的高质量行业数据,通过混合专家系统和垂直精调训练(SFT),让大模型更懂业务,赋能更多专业场景来量身打造专业报告写作、行业规则下的文档审阅、专业Agent助手和行业属性强相关的智能应用产品,现场可以演示专业化的业务问答、行业专属报告写作和业务规则的审阅等。达观数据坚持自主可控的训练数据和算法模型,与国产GPU实现联调对接,提供"算力+模型"的全套国产化信创方案,推动行业创新与发展。"曹植"大模型,赋能百业,引领长文本处理和多语言服务的新篇章。

技术说明

达观数据自研的"曹植"大语言模型是专为国产化需求而设计的AI解决方案。它不仅坚持自主可控的训练数据和算法模型,还实现了与国产GPU的深度联调对接,为众多合作伙伴提供了"算力+模型"的全套国产化信创方案。是基于对国内AI加速卡和GPU市场的深入研究和适配。它完美适配了华为昇腾、燧原、海光等国内主流AI加速卡和GPU,确保了在不同硬件平台上都能发挥出最佳性能。

在技术层面,"曹植"大模型整合了ElasticSearch搜索、OCR、NLP、推荐算法等先进技术,实现了多源异构数据的整合分析。这种数据整合能力,使得企业能够更高效地管理和利用数据资源,提高数据的利用效率和价值。

1、混合专家(MoE)模型

将模型分为若干个专家模块,每个专家负责处理数据的一部分。一个门控机制负责动态选择哪个专家模块应该负责当前输入数据。充分兼容百川、智谱等第三方模型,模型落地性效果好、实用性强。

2、自适应检索增强生成

基于自适应检索增强生成技术,知识管理系统实现了对非结构化文档、数据路、业务系统等多种数据源进行问答,系统框架内置文档、NL2SQL、NL2DATA等自适应路由RAG能力支持。

3、检索增强生成技术深化

增强大语言模型处理问答场景的准确性、稳定性和安全性,让问答产品迁移到不同的业务场景有更强的优秀的效果。同时处理的信息存储对象扩充到更多形态类型。

4、复杂文档理解

使用大型语言模型的优势来辅助理解视觉丰富的文档图像来实现更强大的布局感知和内容理解。同时,更精确的文档结构解析反过来也能更好帮助大模型理解文档内容提高下游任务效果。

5、多模态图表问答

综合视觉信息和语言理解能力,使得大模型能够理解复杂图表和图像中的信息,对其中的数据进行分析归纳和总结,回答用户查询提到的问题。

6、低代码智能体开发

将RPA和大模型Agent能力深度融合,使得非技术用户也能够通过自然语言处理和人工智能能力构建自动化流程。

此外,"曹植"大模型还推出了私有化大模型一体机,完成了全体系的软硬件及配套框架的适配。为企业提供了更加灵活和安全的部署选项。这种私有化部署方式,既满足了企业对数据安全和隐私保护的需求,又能够根据企业的实际情况进行定制化开发和优化。

服务客户

达观智能知识库目前已对接南方航空、中国移动、中国建设银行、微创医疗等来自交通、通信、金融、医疗等多家行业头部企业。广泛应用于企业文档管理、研发知识管理、制度管理和合同管理等多个场景,助力企业用户实现知识的快速获取、高效共享、便捷应用和持续创新。

关于企业

·达观数据

达观数据,国家级专精特新“小巨人”企业,荣获“吴文俊人工智能奖”等多项荣誉,是行业领先的智能知识管理和文本处理提供商。达观数据2015年底成立,专注于各类文本智能处理系统的开发,针对企业内部文档做抽取、审核、比对;文档的管理、问答、写作、搜索推荐;以及跨系统之间的数据自动同步,抓取,填报等。通过自研核心技术,助力企业提升文档处理效率,确保内容准确性,每家企业均可部署专属系统,实现个性化智能办公。

达观数据

达观数据专注智能知识管理软件系统开发,广泛应用于各类知识管理业务的智能化,其自主研发的智能知识管理系统(KMS)、智能文本处理技术(IDP)、智能写作、智能图像识别(OCR)、机器人流程自动化(RPA)、智能搜索推荐等产品,成功赋能百业。

以上由达观数据投递申报的项目案例,最终将会角逐由数据猿与上海大数据联盟联合推出的《2024中国数智产业AI大模型先锋企业》榜单/奖项

该榜单最终将于7月24日北京举办的“2024企业数智化转型升级发展论坛——暨AI大模型趋势论坛”现场首次揭晓榜单,并举行颁奖仪式,欢迎报名莅临现场


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1