“人大系”AI创企「智子引擎」自研多模态大模型，落地社会治理和实体机器人场景 | 早期项目

作者：周鑫雨发布时间：2023-06-01

GPT-4

文 | 周鑫雨

编辑 | 邓咏仪

想要更接近通用人工智能，提高AI对图像、语音、视频等多模态内容的理解不可或缺。相较于注重文本交互的单模态语言模型，多模态模型能将AI领域拓展至识别、检测等更广泛的领域。

成立于2021年， AI创企“智子引擎”是国内较早对多模态大模型展开研究的团队。人大高瓴人工智能学院教授卢志武担任公司的首席技术顾问，并对大模型相关研究成果进行商业转化。

基于今年3月8日发布的“图生文”模型“元乘象 ChatImg1.0”，智子引擎推出了支持语音、文本、图像交互的ChatImg2.0。

元乘象 ChatImg 2.0能够对图像和视频内容进行理解。

相较于主打“看图”的1.0版本，ChatImg2.0新增语音交互功能，并支持视频输入，并在页面新增“发现”功能导航入口。

元乘象 ChatImg支持视频和语音输入，与此同时增加了“发现”功能导航界面。

ChatImg的基座为智子引擎自研的150亿参数多模态大模型。2023年3月，团队在关于多模态大模型“无人区”的探索有了初步的成果：会看图的“元乘象 ChatImg1.0”发布，后续更迭至2.0版本。

智子引擎CEO高一钊介绍，ChatImg 2.0的中文和英文多模态对话能力已经超过了目前主流的开源模型。在多模态对话数据集（LLaVa）的公开评测过程中，ChatImg 2.0对90个问题的回答结果，拿到了GPT-3.5打出的最高分，并与GPT-4的表现最为接近。

LLaVa对元乘象 ChatImg 2.0以及主要开源模型的评测结果。

在应用落地上，基于对复杂场景的识别能力，智子引擎与软通智慧合作发布了城市多模态大模型和城市治理云GPT-Creator2.0。基于软通智慧提供的城市场景、城市数据以及私有化部署及专训，智子引擎联合训练出应用于城市治理事件管理的多模态大模型。

评测结果显示，ChatImg在复杂场景的识别上准确率达到了90%以上。与此同时，城市治理改变了传统“一场景一模型”的部署模式，用特定数据对ChatImg进行微调的解决方案将系统部署复杂度降低了50%以上。

与此同时，智子引擎团队正在对“ChatImg2.0+实体机器人”进行尝试。目前，该团队联合北京理工大学张伟民教授团队共同打造了智能机器人“小象”。与目前市面上大多厂商将AI能力接入辅助硬件功能不同，“小象”的设计则从ChatImg的多模态交互功能出发，为AI打造更贴合的实体智能生命形象。“小象”目前具备语音交互、图像识别等功能。

接入ChatImg 2.0的实体机器人“小象”目前具备语音交互、图像识别等功能。

高一钊告诉36氪，目前智子引擎共有8名全职员工， “做成大模型的人数不在多，而是考验团队每个人的研究能力和工程能力。”此外，首席技术顾问卢志武曾为智源研究院“悟道·文澜”大模型研究团队的核心成员，也是“文澜 BriVL”的主要设计者。

近日，智子引擎完成千万元天使轮融资，主要用于多模态大模型的研发和落地。

“通用化和商业化，是未来5年最重要的两件事。”高一钊对36氪表示，“通用化是学术上对模型能力的优化，但此外能重要的是模型能力能够对现有行业进行颠覆。目前，我们还有很多场景等待落地，在技术上也将会持续发力，这都是对自己竞争优势的一种保护。”

36kr制图

欢迎关注

在当今数字化浪潮中，数据宛如一座亟待挖掘的宝藏，而Snowflake作为新一代云数据平台的佼佼者，正引领着企业走向高效、灵活的数据管理与分析之路。世达教育推出Snowflake认证课程，旨在满足市场对Snowflake专业技术人才的迫切需求，为数据领域从业者提供提升技能与竞争力的优质学习平台。 [图片] （图片来源于官网） Snowflake是一种基于云的SQL数据仓库，其架构设计旨在提供高可用性、可扩展性和性能。Snowflake的架构分为三个主要部分：存储层、计算层和控制层。 · 存储层：负责数据的存

世达IT-薇儿的梦 2024-12-27

选工厂工单系统需考虑功能、适配性、用户友好性、成本、安全性及市场口碑。ZohoDesk提供订单管理、任务分配等关键功能，助力企业提升生产效率、优化流程，实现成本控制和质量提升。一、了解工单系统的基本功能工单系统，亦称作业订单系统，是用来管理和跟踪产品从开始生产到完成的各个过程的系统。它涉及到订单接收、工作分派、进度追踪、质量控制及最终的报告分析等多个方面。通常情况下，一个高效的工单系统应包括以下基本功能：订单管理：系统能够处理来自不同客户的订单，支持订单的修改、取消和重新排程。任务分配与调度：合理的工作流

Zoho云服务 2024-12-27

“人大系”AI创企「智子引擎」自研多模态大模型，落地社会治理和实体机器人场景 | 早期项目

推荐体验

相关资讯

「智子引擎」完成数千万元天使+轮融资，自研多模态大模型落地B端场景 | 36氪首发

全球首个自主进化多模态MoE震撼登场！写真视频击败Sora，人大系团队自研底座VDT

撞车Sora？人大系通用人工智能研发商「智子引擎」完成Pre-A轮融资！

多模态大模型初创企业「智子引擎」完成千万元天使轮融资

人大系多模态模型首次实现自主更新，写真视频生成力压 Sora

近期资讯

ARMORED阿莫得隐形车衣-好车是柔软的“盔甲，抵御生活的尘沙

叉车推雪铲厂家

在线电导率检测仪故障解析及应对措施

解锁数据潜能，从Snowflake认证课程启航

格力电器卖的贵？董明珠回应：价值决定价格

建设现代化城市和城市科学

精选工厂工单系统，打造智能生产流程

1万元差价，全新长安CS75 PLUS选择1.5T还是2.0T？

【高中生物】365条高频考点，有了它，成绩稳上85+！

在线总磷检测仪故障解析及应对措施

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响