21世纪经济报道记者白杨 北京报道
11月14日,阿里巴巴智能信息事业群对外发布了全栈自研、千亿级参数的夸克大模型,并表示该模型将应用于通用搜索、医疗健康、教育学习、职场办公等场景。
据介绍,夸克大模型是阿里巴巴智能信息事业群旗下夸克团队基于Transformer架构自主研发的多模态大模型,在此基础上,夸克还组建了数百人的研发团队,在搜索、教育、医疗等垂直领域中进行大模型的预训练与精调。
事实上,丰富的数据储备,也是阿里巴巴智能信息事业群推进大模型自研的推动力之一。一方面,夸克拥有十分全面的中文数据库,这使大模型能更好地理解、评估、提炼中文知识体系;另一方面,在过去的业务发展中,夸克自建及拥有各类题库、知识点、医疗知识图谱、书籍及出版物等资料,这也是训练大模型非常重要的数据。
在解决大模型“幻觉”以及对不良、虚假信息识别方面,夸克大模型建立了从内容、搜索再到推理的一套可辨别知识真伪的技术体系。而在性能上,夸克团队表示,夸克大模型的整体能力已超过GPT-3.5,在写作、考试等部分场景中优于GPT-4。
另外,对于为何要自研大模型,阿里巴巴智能信息事业群解释称,这是服务于夸克的业务战略。今年以来,夸克App在产品迭代中已经在逐步融入AI技术,而夸克大模型将会优先落地在通识问答、专业搜索等领域。
阿里巴巴智能信息事业群总裁吴嘉表示,AIGC技术将会给搜索产品带来全新变化,夸克也将借助自研大模型进行全面升级,全新的夸克很快就会和大家见面。
更多内容请下载21财经APP