科大讯飞学而思有道入局,教育赛道探索专业领域大模型
华夏时报(www.chinatimes.net.cn)记者 于玉金 北京报道
自 ChatGPT发布之后,生成式AI变为新方向,国内外都掀起了上马大模型的热潮。百度、阿里、华为、360等公司早先一步发布了大模型产品。科大讯飞虽然慢了一步,但是也在5月6日发布了星火认知大模型,科大讯飞董事长刘庆峰当天还表示,“今年我们还将持续升级大模型,10月24日要在中文上超越ChatGPT,在英文上要达到跟它相当的水平。”
值得关注的是,教育是科大讯飞星火大模型四大行业落地应用之一。《华夏时报》记者5月5日从学而思方面获悉,学而思正在进行自研数学大模型的研发,命名为MathGPT;同一天,有道方面也发布了基于“子曰”大模型研发的AI口语老师剧透视频。随着多家公司发布教育领域大模型,将AIGC技术落地到教育场景指日可待。
科大讯飞大模型用于学习机
5月6日,科大讯飞如约发布了星火认知大模型。据了解,2022年12月15日,科大讯飞启动了认知智能大模型的专项攻关,也就是“1+N专项攻关”,1即为通用的认知智能大模型;N则是将大模型在各个领域的落地,包括教育、办公、汽车、人机交互以及医疗等众多领域。
早在今年2月,科大讯飞推出AI学习机T20 Pro,并表示类ChatGPT技术将于5月落地,率先用于AI学习机。
在此次的发布会上,刘庆峰宣布T20系列学习机在语数英主学科上进行了大模型应用落地—首批上线了中英文作文类人批改(学习机端)和生成(家长端)、数学个性化精准学类人互动辅学、英语类人口语陪练功能。
“科大讯飞一直是致力于将人工智能技术服务教育,能够实现让孩子们科学学习,不走弯路,也就是将因材施教,有教无类的理念,通过人工智能技术真正的落到实处;‘双减’师生减负后,学生学习成绩能否提升,学业能力是否得到发展,是家长和社会都关注的事情。”刘庆峰进一步表示,通过讯飞学习机可以精准分析每个孩子的薄弱环节,将无效、低效的重复训练省掉,把对学生当前阶段过难、只会浪费时间、打击自信心的时间省掉,给孩子推荐最适合的学习内容和题目,大幅提升学生学习效率,自信心及学习兴趣,同时也为“五育并举”创造空间和前提。
刘庆峰透露,讯飞学习机已成为行业中用户净推荐值排名第一的学习机,同时在5万多所中小学使用,在多个国家智慧教育示范区和先进教育实验区成功应用。
对于国外是技术先行为底座再进一步推动应用层的发展,中国的大模型生态是应用发展先行的情况,透镜咨询创始人况玉清在接受本报记者采访时认为,中国公司的大模型之所以偏向于行业,则基于中国各行业的技术、数字化落地在全球范围内都是相对领先的,再叠加中国各行业也为AI技术的产业化落地提供了各种各样的场景,因此中国的AI企业在下游落地端会比较强,当然在上游的基础技术、基础算法的贡献上则与国外企业有一定差距。
通信专家项立刚在接受《华夏时报》记者采访时表示,中外对于多态大模型有不同的认知,美国OpenAI发布的大语言模型GPT—3.5、GPT—4还是未来的GPT—5,基本的思维都是用通用大模型作为引擎来解决所有事情,不过在应用到各个细分领域中,如社会管理、社会服务或者教育领域,在保证完全准确性上有一定难度。而中国比较注意大模型的实际能力,用专门的大模型来解决专业的问题,比如生产线的生产管理、客户服务等,在这个过程中不断训练、完善大模型。
项立刚分析认为,中国企业的产品通过解决实际问题得到客户认可,取得相应投入才能进行发展,而国外公司则主要依靠投资及二级市场股价提升获益,比如OpenAI公司去年亏损额达5.4亿美元。
教育公司探索专业大模型
在科大讯飞发布星火认知大模型之前,学而思、有道两家教育公司则先一步发布了在大模型领域进行探索的消息。
《华夏时报》记者5月5日从好未来方面获悉,学而思正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心,目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。据悉,学而思已将MathGPT作为公司核心项目,由CTO田密负责,今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。
学而思AI团队负责人介绍,“LLM大模型来自对海量语言文本的训练,因此最擅长语言处理。行业内偏向基于LLM大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。因此,学而思决心组建团队专研MathGPT—数学领域大模型,用自己在数学和AI上的多年积累,面向全球范围内的数学爱好者和科研机构,做好AI大模型时代的数学基础工作。”
也是在5月5日同一天,网易有道发布了基于“子曰”大模型研发的AI口语老师剧透视频。
据悉,基于“子曰”大模型的AI口语老师和中文作文批改功能研发工作已取得阶段性进展。
网易有道方面人士在今年2月接受《华夏时报》记者采访时表示,“公司在行业内做了很多垂直领域的探索,比如口语练习、作文批改、英文写作、在学术侧也做了很多的纵深。相信这种垂直细分场景的探索,有助于AIGC更好地落地,模型不用那么大,但是在这一细分场景下可以有更好的表现。”
大模型在各行业的应用是当下社会的关注问题。一些公司选择与具有通用大模型的公司合作,在通用大模型上做微调和接口调用,增强原有的产品体验。不过,在一些专业领域,对AI的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用LLM目前的性能表现还无法在上述领域取得突破,因此部分公司开始探索针对专业领域的大模型。
学而思方面表示,公司选择了一条少有人走的路,不基于现有LLM做微调和接口调用、不做通用LLM,而是自研基于专业领域的“数学大模型”MathGPT。
项立刚认为,细分专业领域的大模型能够更好的解决专业领域的问题。他还指出,发展人工智能很重要的一点在于对信息、数据进行标注,才能让训练变成事实,让知识变得越来越准确,但国外很多公司则把标注这项工作交给第三方公司。
值得关注的是,近期,一名谷歌内部研究员在一份文件中指出,“我们没有护城河,OpenAI 也没有。”并称,开源模型才是未来。
对此,项立刚认为,是否开源并不重要,大模型的算法并非十分复杂,中国很多企业今年以来已经发布了诸多大模型,但是后续如何通过大量的训练、大量的语料喂养并在此过程中不断进行专业信息、数据标注变成一个有价值的应用则有一定难度。
况玉清则表示,目前大模型还处于非常早期的阶段,离大规模的产业落地和最终的英雄座重排还有一定的距离,目前讨论未来的行业趋势如何走还为时过早。他还说,“可以肯定的是,无论是通用大模型还是行业大模型,未来AI在各个领域的渗透会加深,由AIGC等一系列新技术问世所引起资本市场的关注,都会令各家公司在AI方面加大投入力度,无论是上游技术还是下游应用都会有一个更好的突破,这个未来趋势是肯定的。”