通用人工智能时代,AI大模型技术成为数字经济下基础设施建设的重要支撑,也成为产业智能化转型的核心“引擎”,AI大模型+产业应用迎来了前所未有的发展机遇。
在10月28日举办的CNCC 2023“超智融合AI大模型应用落地发展论坛”上,智子引擎发布了“元乘象Chatimg3.0”,展示了多模态通用生成模型“元乘象Chatimg3.0”的最新进展与落地探索。
元乘象Chatimg3.0是一个超精细识别、少幻觉的多模态大模型,同时支持多图理解、物体定位、OCR等功能。Chatimg3.0给硬件设备装上了大脑,可实现更自然更流畅的人机交流,为AI多模态大模型赋能产业应用打下了坚实的基础。与Chatimg2.0相比,Chatimg3.0主要进行了两方面的升级,包括第一阶段的预训练(描述、检测、OCR等多任务训练)以及第二阶段的指令微调(高质量的人工精筛指令集)。
为更好的评估多模态大模型的能力,我们构建了一个全新的多模态对话测试集,从描述、推理、检测、问答、业务五个方面对模型能力进行评测,而且在问答和业务两个方面的能力上赶超GPT-4V,表现出优秀的发展潜力。
以下是Chatimg3.0对比GPT-4V在测试中的具体表现:
描述:
推理:
检测:
问答:
目前智子引擎已经将“元乘象Chatimg3.0”应用于全域防控和无人机巡检等领域,通过与无人机、电子探头等前端感知设备的融合,升级传统巡检和安防,实现了AI缺陷识别、异常检测、行为分析、重点监控、自主巡查、风险预测等功能,推动了AI工程化革新进程。
作为国内首个多模态大模型研发团队,智子引擎不仅在人才和技术上拥有先天的优势,多个知名投资机构和IT行业龙头的天使投资,也使企业如虎添翼。在软通动力、华软科技等知名企业的协同助力下,融合“元乘象Chatimg3.0”研发的“智子•天穹”和“智子•天巡”系统一经面世便得到了行业的关注,产品被快速应用于城市治理、智慧电力、管道巡检、园区管理、农业、金融等多行业应用场景,并逐步开始试点部署。
为加速大模型产业应用落地,促进数字经济可持续发展,智子引擎将继续加强模型训练,提高自身能力,汇聚行业人才和优势资源,为大模型助力产业升级鞠躬尽瘁。核心模型“元乘象Chatimg”未来还会在AI agents、具身智能等方向持续发力,期待大家的关注。
本内容系原作者授权转载,镁客网仅提供信息存储空间服务。