AGI时代的起点上,山海逐云破浪,蓄势待发。
来源:猎云精选;文/邵延港
当大家还在讨论“AI孙燕姿”时,在云知声阔别多年的发布会现场,AI模仿网络电台主播程一的声音读了一段AI生成的文案,语气深情浪漫,音色富有磁性,塑造了一个让程一本人都惊讶的“AI程一”。毋庸置疑,这又是出自大模型的“作品”。
来源:云知声
去年12月,入行十年的中国AI厂商云知声创始人黄伟第一次见到ChatGPT时,在震撼之余感受到的却是沮丧,一瞬间觉得自己创业十年来,所积累的技能以及自己安身立命的东西,似乎变得毫无价值。
黄伟和程一的感受类似,都觉得职业生涯将遭受冲击。黄伟在之后用了一周的时间去研究“ChatGPT到底是什么”,后来发现“好像也没什么”,ChatGPT只是把模型做得更大而已,以云知声团队的技术实力和工程化经验也可以做出来。
于是,云知声公司内部在去年12月中下旬组建团队,在今年2月底就拿出来属于自己的第一版大模型,并将其取名“山海”。历经优化和打磨后,5月24日,云知声正式对外发布山海大模型,便出现了文章开头那一幕。
来源:云知声
云知声不是第一家发布大模型的人工智能厂商,当然也不会是最后一个。ChatGPT带来的大模型竞赛的背后,其实是人工智能产业多年来饱受争议和不理解后的爆发。市场从未像今天一样对人工智能如此充满期待,大模型开辟了通往AGI(通用人工智能)时代的新范式,云知声在十余年后站上了AI 2.0时代的新起点。
对于时常因商业化不及预期而被诟病的AI产业来说,大模型的出现仿佛就是光。
所谓大模型,是新技术范式,而非新发明。深度学习算法经过十多年的积累,在Open AI的整合下,调校出轰动世界的ChatGPT。这种新的技术范式,让人类看到AGI时代到来的愿景。山海大模型,正是云知声基于已有算法和知识做的一次工程革命。
在曾经“AI产品跟着客户需求走”的时代里,云知声等人工智能厂商提供专用系统+智能模块的方式,为客户提供鉴别式的人工智能,即运用已有的数据训练模型,完成特定任务,回答是或否来提高决策效率。大模型出现后,其深度理解能力能够生成高质量、创造性的结果,人机交互模式和质量也产生了质变。
云知声在作出研发大模型的决定后,随即组建了一支灵活的团队,用时两个半月后便拿出来第一版,并将其命名为“山海”。据介绍,“山”是高山仰止,是大智知止;“海”是海纳百川,有容乃大;“山海”还代表着云知声的坚持,所爱隔山海,山海皆可平,“山海”的命名便取自其中。
有GPT珠玉在前,云知声为山海大模型赋予的使命是以通用人工智能,创造一个互联、直观的世界。有了山海大模型,云知声将不再是5个月前的云知声。
在发布会现场,云知声现场展示了山海大模型的十项核心能力,其中包括语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力,云知声通过语音输入、实时互动的方式进行讲解演示,在展示过程中也看到山海大模型在某些行业的表现要明显优于GPT4。
来源:云知声
作为云知声5个多月的作品,山海大模型并非只有这十项技能,云知声也不会满足只有十项能力。云知声需要山海大模型具备更多能力来适应客户需求,以打造奔向AGI时代路上的基础实力。
尽管有人认为大模型是巨头的专利,但云知声没有放弃。从2012年入局深度学习,到后来搭建AI全栈能力,再到大模型角力,过去十年里,云知声经历了一轮轮市场洗礼与自我变革。云知声能够成为第一批发布大模型的人工智能公司之一,离不开其在十余年中的每一个坚定步伐。
来源:云知声
在过去十年里,云知声有过三次技术跃迁,被称作云知声的AI三级跳:
第一次是云知声创立时,深度学习之父辛顿带领团队拿下2012年的ImageNet视觉识别挑战赛冠军,云知声紧跟深度学习兴起的浪潮;
第二次是在2016年,谷歌阿尔法狗击败人类围棋冠军李世石,云知声开始重视算力;
第三次即眼下大模型的爆发,云知声迅速跟进,拿到一张通往AGI时代的船票。
纵观云知声的发展历程:2012年,云知声成立时以深度学习切入,构建了深度学习、大数据、超算为核心的AI三驾马车的发展战略;2016年布局了Atlas超算平台及全栈AI技术,发布语用计算平台,2017 年布局行业知识图谱,构建认知技术体系,2018年提出U+X 战略,即以 U(AI 架构及全栈技术),深度结合 X(行业应用场景),解决行业深层问题,向规模化AI进发。
大模型是从小模型、中模型基于算力、算法和数据开始锻造出来。云知声通过可弹性扩容的算力工程Atlas、自研大模型训练和推理一体化框架的算法工程Uniscale、以及历经十年积累到600T行业数据的数据工程UniDataOps,三者结合大力出奇迹,打造了山海之功。
在云知声一直深耕的医疗领域,山海大模型已经调校出极高的行业水准。据云知声介绍,在MedQA测评中,山海大模型、GPT4、Med-PalM、GPT3.5的水平分别达到81.56%、71.07%、67.6%、40.31%;在临床执业医师资格考试中,山海大模型、SOTA分别达到511分、456分,远超365分的平均分和360分的及格线。在医疗领域,山海大模型的表现甚至优于GPT-4中文水平。
来源:云知声
在过去的十年里,云知声从数据算法算力的建设、工程化落地能力以及商业化场景能力均有规划,这才有了云知声发布山海大模型的“底蕴”,以及黄伟发出对“云知声过去的十年仿佛都是为山海而生”的感慨。
当被问及:是不是有了大模型,人工智能厂商的场景落地和商业化就会变得容易了?黄伟称,这个问题到今天应该有个明确的答案了。有了大模型,AI厂商具备了更强大的能力,能够更好得满足客户需求,也能更容易地去商业化落地。
在AI 1.0时代,虽然基于深度学习,每家都有强大的技术,但整体上并没有本质改变AI用于分类的任务,分类种类的增加仍然处在量变阶段,限制了AI创造价值的上限。到了AI 2.0时代,大模型为人工智能带来了更多的能力,可以打造更多新的产品,满足客户更多的需求。
来源:云知声
山海大模型能做什么?黄伟表示,云知声将以山海大模型为基础,打造MaaS 模式的AI 2.0解决方案,在通用能力基础上,增强物联、医疗等行业能力,为客户提供更智能、更灵活的解决方案,打开更大的AI技术产业化商业空间。
AI只有落地应用才能实现价值,这句话至今依然适用。云知声将大模型视为人工智能2.0时代的发电厂,可以更充分地利用数据的价值。黄伟认为,谁掌握了大模型,也就会具备更大的商业价值。
来源:云知声
在发布会现场,云知声围绕着十大核心能力,与具体场景做融合。作为云知声的核心业务场景,山海大模型在MedQA和临床执业医师资格考试中强于GRT4的结果,振奋了山海大模型的研发团队。在智慧医疗领域,有了山海大模型加持,原产品最新融入了手术病历撰写助手、门诊病历生成系统、商保智能理赔系统三大医疗产品应用。
如手术病历撰写助手,在外科医生手术过程的语音已经录入的情况下,山海大模型通过理解和分析能力,过滤掉无关内容,将医生在整个手术过程中零散的口头化的语音信息进行理解标化成信息摘要,形成手术记录所需要的关键信息。人工审核完成后,最终帮助医生撰写一篇五百到一千字的手术记录,解决医生费时费心撰写手术记录的痛点。
来源:云知声
在云知声重点布局的智慧物联场景中,山海大模型也将会进行场景融合,塑造出一个真正的随身管家,使其在方方面面从只能进行指令交互升级为类人对话,真正联动IoT生态和服务。
此外,在销售、知识管理和教育场景中,云知声也会基于山海大模型,对产品进行升级,让信息反馈更精准,以满足用户更深层次的需求。
但山海大模型的意义不只是未来升级现有的场景应用能力,不断拓展其作为AGI的边界才是真正使命。
山海大模型目前仍在升级中,5月24日发布的版本已经在模型参数和量化方面,进行了很多工程优化,相比二月底的版本,在推理速度方面提升了五倍。云知声的目标是在2023年内将山海大模型的通用能力比肩ChatGPT,并在医疗、物联、教育等多个垂直领域能力超越GPT4。
来源:云知声
在商业化拓展的规划上,云知声称会继续施行U+X战略,构建AGI+Industry生态,继续赋能百业。在发布会上,云知声与中建电子、京东科技、360签署战略合作协议,深度合作形成生态,推动山海大模型在各领域的落地应用。
黄伟说:“我相信,山海将成为连接世界、拓宽人类认知边界的桥梁。在未来的探索与发展中,云知声将一如既往地秉持创新、开放、合作的精神,与合作伙伴共同努力,推动人工智能技术的发展,为人类的未来注入无限活力。”
在AGI时代里,暂时无法去定义大模型的边界在哪里,对于AI从业者来说,当前的确是到了AI落地应用得更好的时代。山海大模型的能力在增强,未来也将在一次次的未知中探索更精妙的答案。