预·见成都大模型
人工智能的发展如火如荼,正与千行百业融合,迸发新的科技力量。大模型作为人工智能竞争的关键,今年将踏入变现元年。
红星资本局注意到,在这场产业竞争中,近3年,成都人工智能产业规模复合增长率超40%,“人工智能科技产业竞争力”已排名全国第6。四川省今年更是把人工智能列为“一号创新工程”。
近日,红星资本局专访成都多家AI大模型厂商,与他们探讨人工智能趋势中的“成都力量”。
今年5月,成都明途科技有限公司(以下简称“明途科技”)的“明途WorkGPT”大模型通过《生成式人工智能服务管理暂行办法》备案审批。再往前的今年2月,明途科技的工作内容生成算法成功通过国家互联网信息办公室深度合成服务算法备案。自此,明途科技成为了拥有“双备案”的大模型厂商。
近日,红星资本局对话明途科技董事长肖雪松。他认为,要把“强化学习”作为垂类模型当中较为核心的能力。数字人则是元宇宙再次崛起、再次发展成新兴产业的一个重要催化剂。
肖雪松 图由受访者提供
“学校”场景可能会更快爆发
红星资本局:公司做数字人分身的初衷是什么?公司的垂类模型更擅长什么?训练侧重哪方面?
肖雪松:做数字人分身的初衷就是想把每个人的重复性工作、低效率工作,用人工智能的方式快速辅助替代。目前有3种形态展现。
第一种是APP,相当于每个人都创建一个分身,可以给自己的数字人分身喂养知识,赋予它基础能力和业务能力,比如说帮你写作,帮你制作视频等等;
第二个形态是把数字人跟盒子或者桌面型的办公机器人结合,形成智能终端,比如把数字人分身植入大屏中,你就可以通过一个盒子跟对方对话、安排任务;
第三种形态是植入机器人里,它可以根据你的指令去执行一些动作,比如说帮你拿东西、接待客户等等。
我们有个“明途WorkBrain”综合型的模型结构,认知智能这一部分就属于垂类模型。它的参数量在150亿-200亿之间,我们用办公数据来训练,包括人事职责、岗位职责、工作流程、管理制度、项目管理的规范等这些知识。
早期我们是以办公领域为主,从办公过程中的数据来进行汇聚分析。最近我们也在往医院、学校等领域拓展,比如医生、学生、老师的数字人分身,相关意图也可以得到快速增强。
红星资本局:数字人分身的应用场景在哪里,最快能够实现落地的方向是什么?
肖雪松:比如在办公场景,应用较多的是围绕员工周报、总结工作等任务,数字人分身可以按照指示快速完成工作,还能利用数字人分身实现群体协作的能力。
如果是在校学生,学习课程的能力跟数字人分身结合,就可以直接跟分身沟通学习问题。我们和电子科大认知智能实验室一起研发了个考试系统,把批改试卷、作业的能力和数字分析结合,这个数字分析也可以帮助学生自动检查在做题过程中哪些知识点没有掌握,数字分身会提醒学生把没有掌握的知识点作为学习重点。
在心理咨询场景,跟自己的数字分身去交流,不牵涉到隐私问题,可能比心理机构介入得更容易些。
在健康领域,特别是针对老年人,这类人群的基因数据可以和数字人分身结合,包括体检内容。一方面是确保自身健康信息安全,另一方面,根据健康信息,可以帮助使用人维护日常健康的生活习惯。我们也陆续在一些医院跟他们原来的智慧信息化系统结合,辅助医生和医院做患者服务。
另外,我们自己判断可能“学校”这个场景会更快爆发,因为学生接受新鲜事物会更迅速,国内一些高校已经在尝试做数字人分身了。“分身”相当于是你自己的“助手”,可以把自己关于学习、工作、健康方面的数据“喂养”给它,它就会帮你完成计划或做初步准备。
红星资本局:这个数字人和之前见到的有何区别?它的交互能达到什么水平?未来希望可以实现怎样的状态?
肖雪松:数字人经历了4个时代,第一阶段是绑定一个二维形象,相当于IP;第二阶段是虚拟数字人阶段,把人的表情、语音、形态和数字人结合;第三阶段就是跟大模型的初步融合,比如在文旅和电视台我们经常看到的数字人播放节目;第四阶段则是“产业数字人”,融入到服务业、生产业、农业等,这样细分领域内和数字人深度绑定,同时产业数字人也可以和上下游协同联动,从而进行群体协作。“数据知识的产业化”和“群体智能的产业化”,是“产业数字人”两个典型的标志,现在我们就处于第四阶段。
我们也正在做一个“盒子”,实现虚实交互,跟原来AR、VR有点类似,通过你的表情、人脸识别、手势识别等等,它能够把一个虚拟数字人和现实中的真人之间,进行互动。比如开虚拟会议,其中一个同事无法参加,由于他的数字人分身跟这个“盒子”是绑定在一起的,开会的时候就可以把他的“盒子”插在电视上,他的数字人分身就会出现。
数字人分身 图由受访者提供
开会的时候按照流程,发言或者演讲PPT都可以进行,很像我们在电影里看到的场景。现在场景已经可以初步实现,但还有一些技术难点待突破。比如多场景混合语音下如何辨别、如何插话等。
这些难点突破之后,就能达到“可以随时打断”的状态,被打断之后数字人回答问题,然后再回到之前的逻辑里继续说。技术成熟以后,教师、直播销售、无人值守等方面就能达到可商业化水平。
数字人是元宇宙再次崛起的催化剂
红星资本局:今年也被称为大模型应用元年,您认为目前整个行业趋势如何?
肖雪松:目前大模型还存在幻觉、针对性不强等问题,这导致大模型不太可能在短期之内靠本身的智能化水平来推进应用场景的落地。从目前整个业界的声音来看,垂类模型的应用是一个方向。
原来大模型更强调的是,“深度学习”来实现通用智能化水平的提高,但现在我们发现实践中可能“强化学习”更重要。要把“强化学习”作为垂类模型当中较为核心的能力。
早期解决某个单一应用场景的时候,大模型显得很笨,但是用久了,你会发现他越来越聪明,越来越靠近你想要的东西,这就是“强化学习”发挥了很重要的作用。
在强化学习的融合之上,如果能有一种机制出现,或许也可以加快大模型人工智能落地的速度。
从目前C端的爆发级应用来看,我感觉还有点悲观。国外现在也有一种新说法,就是取决于“世界模型”有没有构建成,它的构建会出现新的爆发性应用,而且会改变人工智能早期的开发方法,甚至一些理念都会被颠覆,但这个实现难度很高。
在B端和G端,面向某个场景更具象化的应用,我预计今年内会有部分通用AI的应用跑出来。
红星资本局:明途对元宇宙也有涉及,比起现在的人工智能热,元宇宙相对“冷”了,您怎么看待人工智能和元宇宙这两个市场?
肖雪松:元宇宙早期遇冷是因为,早期没有人工智能的时候,它更多的是把虚拟现实融合,用数字孪生的方式构建一种新的体验。没有生物体或者智能体在其中把各种资源发掘出来。
任何虚拟世界中如果没有“人”这一要素去参与,就是静态的虚拟世界。数字人分身,其实就是把人的智慧跟数字人结合,静态的元宇宙如果加入了数字人要素,能够进行相互交流沟通、虚拟社交、商业化活动,这个世界就能活跃起来。
数字人则是元宇宙再次崛起、再次发展成新兴产业的一个很重要的催化剂,在元宇宙中还有未来虚拟产业,比如跟文创相关的、跟数字产品相关的包括文学艺术游戏等其他虚拟产业,元宇宙是一个非常重要的载体和发展趋势,但是它的催化剂应该是数字人。
资本还需持续投入技术
红星资本局:成都在发力人工智能方面有哪些优势?作为企业,哪些政策和帮扶是很有必要的?
肖雪松:“人工智能”是今年四川省“一号创新工程”,成都从事软件行业、数字产业行业相关的人才丰富,有着人才及应用需求的优势。同时,现在政府在开通一些场景,政务方面也都在鼓励大家用人工智能来升级现有的信息化。
驱动信息化升级很有必要,经过这么多年的信息化建设,其实企业有大量的数据,也有比较成熟的流程化支撑管理体系,当前是要用人工智能来进一步发挥数据的要素价值,对原来使用较为繁杂的内容进行升级,把需求市场放大。
资本市场上,我认为还是要创造更宽松的环境,更持久地投入。在强化学习、垂直领域内,我们还有很多技术细节没有掌握,需要有一定的投资来支持介入,这是长期投入的事,并非有场景或者补贴就可以解决。
红星新闻记者 王田
编辑 邓凌瑶
IT之家 2024-12-23
热点科技 2024-12-23
热点科技 2024-12-23
IT之家 2024-12-23
科技狐 2024-12-23
36氪 2024-12-23
IT之家 2024-12-23
IT之家 2024-12-23
三言科技 2024-12-23
IT桔子 2024-12-23