首发百天后,星火大模型的三场升级战
作者/ IT时报记者 孙妍
编辑/ 孙妍
8月15日,正值讯飞星火认知大模型首发100天,科大讯飞发布讯飞星火认知大模型V2.0,突破代码和多模态两大技术能力,一口气推出众多应用,并联合华为发布讯飞星火一体机。
“今年10月24日,讯飞星火将全面对标ChatGPT,中文超越、英文相当,明年对标GPT-4。”科大讯飞董事长刘庆峰自信地预告讯飞星火大模型的未来目标。
8月15日也是生成式人工智能的重要节点,由国家网信办等七部委发布的《生成式人工智能服务管理暂行办法》正式施行。这标志着中国生成式人工智能迈入了发展与安全并重、创新和依法治理结合的道路。
“百模大战”正在解放生产力、释放想象力,大力出奇迹之下,大模型这一算力“吞噬者”导致高性能GPU遭疯抢,而算力“垄断者”的凸显,让中国人工智能企业达成共识,实现算力国产化解决卡脖子困境。
距离首发100天,讯飞星火认知大模型V2.0如期而至,重点在代码和多模态上实现技术突破,并将这两大能力落地到应用和产品:会生成代码或改Bug的智能编程助手iFlyCode1.0,视频创作能力升级的讯飞智作2.0,帮助教师一键生成课件的星火教师助手,学生口语练习“搭子”星火语伴2.0,新增AI编程空间和AI创意画板的讯飞AI学习机。
在科大讯飞的计划中,讯飞星火代码各维度的能力将在今年10月24日超越ChatGPT,明年上半年对标GPT-4。刘庆峰介绍,根据OpenAI构建的代码能力公开测试集HumanEval,星火V1.5 Python语言的效果只有41分,V2.0已经到了61分,接近ChatGPT。根据认知智能国家重点实验室构建的代码的真实的场景使用的测试集,讯飞星火代码生成和补齐维度上已经超过了ChatGPT。
“代码能力是大模型聪明程度的重要标志。”在刘庆峰看来,代码是大模型硬碰硬的实力,可以大大降低数字经济的创业门槛和成本,不用人人都是编程高手,只要发挥想象力。
用Python画红色的心形线,画出马鞍面方程三维立体图并设置渐变色,用代码生成贪吃蛇小游戏,用小视频生成gif表情包……在现场演示中,讯飞星火2.0完成了所有初级考验,科大讯飞研究院院长刘聪几分钟就完成了两个手指捏合就能写字的“凌空手写”功能开发,全程没写一行代码,全部交给智能编程助手iFlyCode1.0,以往有经验的程序员,也要半天到一天才能完成。
为了降低“小白”写代码的门槛,讯飞星火2.0在代码生成、代码补齐、代码纠错、代码解释、单元测试生成这5个维度进行升级。
现在,“零编程基础”的老师也能用其代码能力开发学校管理数字化应用,数字教育基座这一行业应用已在上海、湖北等地的学校试点,教育应用开发周期从17天缩短到1天,投资成本从15万元降低至1.5万元。
拍了美图想“秒速”发一个图文并茂的朋友圈?张嘴就想画出脑海里突发奇想的图画?只要输入一段文字,一键就想生成声情并茂的短视频?
在发布会现场,讯飞星火2.0在现场演示了它在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面的能力。
“创作一篇立秋抒情散文,并用一个短发民国风的女生形象生成视频”,刘聪话音刚落,一个身穿民国风格的女主播站在不断切换的秋天美景前娓娓道来。
AI视频生成对品牌宣传、新闻媒体等行业来说,是能带来巨大变革的生产力工具,但目前大模型生成的视频,模板较为单一,比起其它大模型厂商,科大讯飞的优势主要还是文转音、中英互译等。
教育是讯飞星火最先切入的行业,星火教师助手可以帮老师一键生成教学课件,至今已服务全国超过2.5万所学校、超1200万名师生;星火语伴可以成为学生、商务老师的口语陪练老师,2.0版本上线CET、雅思、托福等口语模考,用AI实现如真人般的陪练;讯飞AI学习机新增AI编程空间和AI创意画板,这也是学习机行业首款AI一对一智能编程助手;AI口语功能已上线讯飞翻译机,支持73个不同场景。
由此可见,科大讯飞在自有终端和行业市场多年的深耕,是讯飞星火认知大模型能真正落地的基础,下一步,它还将切入汽车行业,首款搭载讯飞星火的奇瑞汽车也将发布。
“多模态是通用人工智能的必经之路,也是科大讯飞既定的人工智能技术长期战略。”刘庆峰表示,2022年初,ChatGPT还未引爆之时,讯飞就已发布具备多模感知、深度理解、多维表达、运动智能等能力的“讯飞超脑2030计划”,而科大讯飞的长期战略是打造每个人的AI助手。
当天,讯飞星火和昇腾AI联合推出星火一体机,其底层算力、AI框架、训练算法、推理能力、应用成效等全栈AI能力“开箱即用”,每一家企业或机构都能在这一国产大模型底座上构建自家的专属大模型。
今年7月6日的世界人工智能大会上,讯飞和华为就已官宣,正在打造中国自主创新的通用智能新底座。昇腾AI是国内唯一一个完成千亿参数大模型训练并商用的系统,已有一半的国产大模型是由它的算力驱动,华为昇腾计算业务总裁张迪煊表示,昇腾只做好算力,不做大模型。
星火一体机由华为保障算力,由讯飞保障内容,给自主可控的专属大模型上了“双保险”。
污语料和幻觉问题是大模型的两大安全挑战,基于讯飞星火认知大模型,星火一体机形成了内容安全机制,具备了清洗互联网语料的能力,语料经过语句判别器、质量判别器、隐私判别器、安全判别器等关卡,就能被清洗成高质量文本“喂”给大模型;针对大模型一本正经胡说八道的“幻觉问题”,科大讯飞构建专业知识库,以类搜索插件技术实现知识获取,大模型理解后概括摘要输出答案。
星火一体机是国产软硬件一体的专属大模型解决方案,企业可以在这一底座上定制问答系统、对话生成、知识图谱构建、智能推荐等多个应用,大大降低了企业定制专属大模型的门槛和成本。科大讯飞在政务、电力、教育、医疗等行业深耕多年,落地经验浓缩成星火一体机内的10多个场景包,涵盖办公、代码、运维、客服、营销、采购等。
讯飞星火认知大模型的定位是“国家队”大模型。“我们正在跟华为打造面向超大规模大模型的训练国产算力的集群,形成集群化优势。”刘庆峰表示,要让每个企业都有专属大模型,安全可控、场景驱动、专属模型是关键三要素,而实现大模型的安全可控,要解决算力安全和内容安全两大难题。
排版/ 季嘉颖
图片/ 科大讯飞
来源/《IT时报》公众号vittimes