来源|多知网
作者|王上
图片来源|多知网
多知网今日获悉,有道专为教育场景自研的类ChatGPT模型将推出,模型名字确定为“子曰”。目前,基于“子曰”研发的AI口语老师和中文作文批改demo已完成,并将于近期开放内测。
此前在2月初,媒体报道称有道AI技术团队已投入到ChatGPT同源技术(AIGC)在教育场景的落地研发中。
不少观点认为,ChatGPT有望带来教育内容和教学方式的革命性变革。目前,国内包括网易有道、科大讯飞和好未来等多家教育公司均透露了类ChatGPT的产品和技术信息。
ChatGPT让全球看到了AGI(通用人工智能)的强大,其是大模型(Large Language Model)是指在大规模语料库上训练的语言模型,通常采用深度学习算法,能够处理自然语言中的语法、语义和上下文等多种信息,并能处理各种自然语言,进行多轮对话。此外,ChatGPT还是一个通用的、可扩展的、跨多个应用场景的语言模型架构。这3个多月以来,ChatGPT在不断演化,从GPT-4来看,它是多模态的,即支持文本、图像、视频、音频等。
在国内,目前已经形成了三个不同的发展派别,包括以百度、华为、360等为代表的通用大模型派,以有道、京东云、同花顺等为代表的垂类模型派,以及以王慧文、李开复、王小川等为代表的ChatGPT创业派,三方都希望实现GPT从技术到产品、场景的商业化落地。
有道的“子曰”是“大模型+小样板”在教育领域的一次尝试,相比通用模型,“子曰”在教育领域内的数据是否更全面,交互会更精准?具体效果尚待验证。
01
有道自研垂类模型,或将率先用于口语练习环节
教育是ChatGPT的最佳应用场景之一,GPT-4的发布会上,有6个落地应用案例,其中两个是关于教育的,一个是多邻国,一个是可汗学院。这也是有道自研教育类大模型的价值。
根据多邻国的披露,在嵌入GPT-4后,多邻国加入了两大功能:解释我的回答(Explain My Answer)和角色扮演(Roleplay)。
(图片来源:多邻国官网)
多知网了解到,有道基于“子曰”模型研发的AI口语老师和中文作文批改相关demo已完成。
多知网从接近有道的消息人士获悉,“子曰”将首先用于英语口语陪练环节。比如在练习口语当中,用户可以与“子曰”进行多轮对话,跟真实场景的对话类似。并且,“子曰”还能引导用户“开口说话”。
这或许跟多邻国的角色扮演类似,可以在相应的语言环境中扮演不同的角色进行口语练习。
在教育领域,很早就有AI形式的口语练习,但是预设好的场景,基本是剧本式的对话,比较一板一眼,不太符合真实的口语环境,不能很好地解决用户练口语的需求,而大语言模型或许可以带来开放式的对话,帮用户练习实际的场景口语。
此外,以往的对话练习是单一形态,而基于“子曰”模型打造的AI口语练习产品,用户可以直接输入语音或者文字,进行多轮对话。某种程度上看,这是更具个性化的一对一陪练,具有一定的非标性。
值得注意的是,“子曰”作为陪练老师的角色,回复是否准确,是否真正理解“人”的特征最为关键,这背后对于“子曰”的要求是非常严苛的。
有道在语言学习方面涉足较早,2007年有道推出了互联网词典,这让有道积累了较多的语言学习语料,这些语料包括了搜索信息、文本信息等。这也提供了“子曰”在口语场景最先应用的土壤。
创新工场董事长兼首席执行官、创新工场人工智能工程院院长李开复在 “AI 1.0到AI 2.0的新机遇”的媒体分享会上提到:“AI进入2.0时代,所有应用都会被重写一遍。”
未来,如果“子曰”足够强大,那么,它可以重构教育的每一个环节。
02
垂类模型能跑出来吗?
今年以来,ChatGPT在全球持续高热,国内外科技企业纷纷入局竞速。不过,是直接对标ChatGPT还是做垂类模型?不同基因的公司选择了不同的道路。有道选择了做垂类大模型。
很多人的疑问是垂类大模型真的能跑出来吗?
上海证券3月20日刊文称,ChatGPT基于“大模型+小样本”结合下游具体应用场景(基于通用大模型“深度学习”行业小样本)有望形成差异化的垂类大模型。
从ChatGPT的开发机构OpenAI来看,其通过投资布局了一系列落地场景。其中,OpenAI投资了一个教育项目Speak,这是一个人工智能口语训练平台,帮助更多人流利地掌握包括英语在内的新语言。从这个路径可以看出,ChatGPT同样缺乏垂类的数据,否则不会投资垂类公司来获取语料了。
可以说,如果有教育垂类大模型跑出,或许应用成本会更低,也更便捷。
值得注意的是,大模型的跑出,需要数据、算力、算法,教育垂类也不例外。有道推出“子曰”,背后是其在教育内容、硬件和技术方向上长期坚持。
在数据层面,针对教育领域,有道覆盖从少儿到成人全年龄段的数据。不过,对教育领域来说,容错率很低,准确至关重要,这就需要在数据训练中需要数据足够多,参数越多,就越精细。
算力方面,一个很大的问题是成本。根据测算,训练一次ChatGPT要450万美元,需要10000张A100训练一个月。GPT-3有1750亿参数,GPT-4的参数据说有100万亿,而ChatGPT的推理更贵。谷歌预测,如果其所有的搜索都用ChatGPT完成,需要购买1000亿美元的GPU芯片,ChatGPT每搜索一次的成本都超过了1美分。
只针对教育垂类,可能成本会有所下降。在成本中,芯片是重要的因素之一。在此前的瑞芯微开发者大会上,瑞芯微曾透露,有道与其合作已有五年之久。其中的代表项目有:围绕着Rockchip NPU来深度优化有道AI模型的效率和效果。据了解,有道词典笔P5产品已升级至NPU方案,相对CPU版本的模型推理速度提高了4-10倍,实现了实时的一目十行识别;在模型大小增大15倍的基础上,AI引擎精确度大幅提升。
算法方面,国内企业的算法已经比较成熟,不过,有道“子曰”能达到什么程度尚不得知。
在技术层面,从GPT-4可以看到多模态成为趋势。公开资料显示,有道自2016年开始协同构建AI基础能力,同步组建语言、视觉、声音团队,为多模态打下基础。
(图片来源:有道智云官网)
以翻译为例,有道词典笔通过OCR、智能组段、机器翻译、 图片渲染多个技术的应用,实现了用户拍照整页文字即可即时实现文档翻译。
除了自研模型和落地应用以外,有道旗下的网易云课堂最近上架了两门AI自研课程:《人工智能绘画与设计》及《ChatGPT从入门到熟练(办公自动化)》。
可以看到,在新技术来临时,有道是有准备的。
有道的“子曰”可以说是在搜索技术的老家底上,叠加了AI能力,并连接了整个有道生态,即通过建立“AI+硬件+内容”闭环,打通了产业链条,便于“子曰”较快实现商业化落地。
这一次,有道希冀有一个较高的占位。
值得一提的是,在教育领域,不少企业此前都已经构建了AI能力,垂类模型暗流涌动。
END
本文作者:王上