“智能化时代正在开启,人工智能将成为各行各业的新型生产力,对算力提出更高的要求。目前中国80%的科技企业,一半的大模型公司都跑在阿里云之上。”10月31日,履新阿里巴巴集团董事会主席的蔡崇信亮相2023云栖大会。
图源:企业供图
他在会上表示,“不开放就没有生态,没有生态就没有未来。阿里云要做AI时代最开放的一朵云。”
当日,阿里云CTO周靖人公布了阿里自研大模型的进展,发布千亿级参数规模的通义千问2.0,以及一站式模型应用开发平台阿里云百炼,同时,基于通义大模型训练的8个行业模型集中亮相。
通义千问2.0发布
10月31日,阿里云发布通义千问2.0,通义千问APP在各大手机应用市场正式上线,所有人可通过APP直接体验最新模型能力。
回顾通义大模型的发展历程,2022年9月,阿里云发布自研大模型“通义”大模型;今年4月正式对外发布“通义千问”;7月宣布AI绘画创作大模型“通义万相”开启定向邀测;8月宣布“通义千问”正式开源;9月宣布“通义千问”大模型已首批通过备案,并正式向公众开放。
图源:企业供图
阿里云CTO周靖人介绍,过去6个月,通义千问在性能上取得巨大飞跃,相比4月发布的1.0版本,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。目前,通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。
通义千问2.0在指令遵循、工具使用、精细化创作等方面作了技术优化,能够更好地被下游应用场景集成。通义大模型官网上线了多模态和插件功能,支持图片输入、文档解析等细分任务。
与此同时,基于通义大模型训练的8大行业模型组团上线,他们分别是智能编码助手通义灵码、AI阅读助手通义智文、工作学习AI助手通义听悟、个性化角色创作平台通义星尘、智能投研助手通义点金、智能客服通义晓蜜、个人专属健康助手通义仁心、AI法律顾问通义法睿。
8大行业模型面向当下最受欢迎的多个垂直场景,使用领域数据进行专门训练。其中,通义星尘、通义点金、通义智文等是首次亮相;通义灵码已在阿里云内部大规模采用;通义听悟每天处理5万余个音视频,目前已累积用户超100万。
据了解,截至今年10月,阿里云已与60多个行业头部伙伴进行深度合作,推动通义千问在办公、文旅、电力、政务、医保、交通、制造、金融、软件开发等领域的落地。
周靖人透露,阿里云计划近期开源通义千问72B版本,此前,阿里云已先后开源7B和14B版本模型,模型累计下载量超过100万。
会后,周靖人在接受时代周报等媒体采访时表示,阿里云并不打算做C端产品,而是会把模型能力开放出来,以API的形式,让开发者集成模型的能力来解决自身需求。
“如果开发者自身有能力,我们会提供开放工具帮助其自己来完成模型开发。如果开发者需要能快速使用的模型接口,那么阿里云会提供相应的应用模型,把接口开放出来,支撑他们在云上开发AIGC应用。”周靖人说道。
大模型应用加快落地
时代周报记者现场了解到,通义大模型系列是基于人工智能平台PAI训练而成。除了通义大模型,中国一半大模型公司都跑在阿里云上。
举例来看,在云栖大会现场,复旦大学浩清教授、人工智能创新与产业研究院院长漆远表示,作为国内高校最大的云上智算平台,复旦大学智能计算平台CFFF(Computing for the Future at Fudan)在气象、化学分子预训练、医疗等科学大模型上都已取得重大进展。
4个月前,CFFF正式上线。这台科研“超级计算机”由复旦大学与阿里云等共同打造,支持千亿参数的大模型训练,总体算力规模跻身全球前15名。
CFFF上线当日,复旦大学人工智能创新与产业研究院李昊团队发布了中短期天气预报大模型,这是首个基于CFFF平台训练的科学大模型。45亿参数量的天气预报模型只用一天完成训练。
图源:企业供图
漆远介绍,除了气象大模型,这几个月来基于CFFF平台训练的其它科学大模型亦有重大进展。其中,化学分子预训练大模型可预测候选化合物成药性和安全性;千亿参数规模的医疗大模型,针对医疗场景深度定制,形成了覆盖就医全流程多场景的医疗AI专业能力,可助力诊疗智能化。
在云栖大会主论坛上,童语故事创始人张华还分享了一位父亲用大模型创业的故事。
3个月前,他们上线了国内首个AIGC的儿童绘本产品“童语故事”,部署在淘宝和微信小程序里。用户上传头像后可进行数字分身创建,接下来只需在故事主题栏中输入一句主题,如“如何解决孩子爱哭的问题”,就能得到以该数字分身为主角的特定主题童话绘本。
张华并非程序员出身,作为新手父亲敢“深入”最新技术,还源于用大模型为女儿做了第一个故事绘本。“那时候ChatGPT刚发布,大模型很受关注,我就想能不能自己做一个绘本?”他说道。
张华尝试做了一个故事,女儿特别喜欢。这促使他萌生创业的想法:用大模型为小朋友做他们真正喜欢的专属绘本。
目前,百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型。蔡崇信表示:不开放就没有生态,没有生态就没有未来。阿里云要让开发AI、使用AI变得更加容易和便宜,帮助各行各业、特别是中小企业,把AI转化为巨大的生产力。