2023年最火爆的领域大概就是人工智能了,ChtaGPT的爆发让人工智能大模型成为炙手可热的领域。目前国内多家公司已经发布或者宣布开始研发自己的大模型产品,在兵荒马乱之余不仅让很多人产生了不少的疑问,到底人工智能大模型最终的发展方向会是怎样?谁会在这场竞争中胜出?
最重要的是,人工智能大模型会给我们的生活带来哪些切实的改变?又将会产生什么全新的价值?从这些问题出发再去思考这个问题,你会觉得真正能够产生结果的恐怕还要是在这个领域有深厚积淀的老牌AI公司,作为这个领域的领军企业,讯飞无疑是一个最有力的竞争者。而在今天,讯飞发布了自己的大模型产品星火大模型,向业界给出了自己的答案。
大模型时代来临
最近几年人工智能领域确实获得了极大的发展,包括图像识别、语音识别等领域已经有了极大的进步。讯飞就是其中的佼佼者,几乎以一己之力带动了语音输入法习惯的变革,现在用语音输入转成文字的做法已经成为了很多人甚至很多职业的习惯。
不过,之前AI的发展和落地依旧还是有一些瓶颈,尤其是在应用场景和领域上还有不小的局限,并不是所有的场景都可以很快的接入AI,更多的时候还是会像阿尔法狗那样,只是专门训练用来从事下围棋一项工作。而人工智能大模型的出现,则彻底改变了这个现状,让整个行业进入了一个发展的全新阶段。
因为传统的人工智能技术需要企业投入大量的资源和时间来进行训练和部署,而人工智能大模型可以通过大规模的数据训练和优化,快速地提高自身的准确性和效率,从而为企业带来更高效、更智能的商业应用。
换句话说,机器的自我学习和提升已经成为可能,而且思维模式也越来越接近人类,这使得无论是从交互方式上还是交互结果上,都有了很大的提升。这有点类似当年电脑发明时机器语言的诞生,人们终于可以用自然语言完成和的沟通了。
当然,大模型虽好,现在还是处于一个比较早期的阶段,也存在不少的问题和挑战。比如人工智能大模型需要消耗大量的数据和时间进行训练和优化,成本是非常高的。开发了ChatGPT的OpenAI公司,去年的亏损翻倍达到了5.4亿美元左右,可以说是一个价格非常昂贵的技术突破了。从另一个角度来说,AI大模型也只能是大公司玩的游戏。
对于这个问题,科大讯飞董事长刘庆峰认为:“这次‘智能涌现’带来的技术阶跃,将带来生产效率几何级提升,深刻改变全球的产业格局,同时也将深刻改变人类的生活方式。”刘庆峰指出,认知智能大模型通过海量信息的参数化全量记忆、多角色多风格长文本生成、任意任务的对话式理解及复杂逻辑的思维链推理,带来了通用领域“智能涌现”的全新机遇。
而讯飞依托认知智能全国重点实验室的长期积累,快速开启了认知智能大模型技术及应用”专项攻关,并且提出了1+N的战略思路,其中,“1”是通用的人工智能底座,“N”是在教育、医疗、办公、人机交互、车载等领域的行业纵深应用。
我觉得这个思路还是非常务实的,人工智能大模型再聪明,也不能做成一个万金油,最终还是要从聊天工具落地成产业工具,才能真正成为生产力提升的核心动力。而在人工智能的垂直领域落地方面,讯飞在教育、医疗、办公、汽车等多个领域都有非常深厚的积累,这也成为讯飞星火大模型的基座和底气。
星火大模型测试表现出色
对于讯飞而言,最大的优势还是在深度学习和自然语言处理技术这些领域的多年积累上,并以此打造了讯飞星火认知大模型的七大核心能力,包括多风格多任务长文本生成、多层次跨语种语言理解、泛领域开放式知识问答、情景式思维链逻辑推理、多题型步骤级数学能力、多功能多语言代码能力、多模态输入和表达能力。围绕讯飞星火认知大模型的七大核心能力,刘庆峰开启了实打实的现场演示,而且是直接使用语音交互来进行现场的实际演示。这就区别于之前很多厂商的录播和手动输入,显然更符合人的交流习惯,也证明了讯飞在技术上的优势和自信。
而星火大模型的表现也是非常优秀的,除了有问有答的基本能力外,在场景理解、共情乃至数学计算方面都有着非常准确的表现。比如对“俗话说男子汉大丈夫宁死不屈,但是俗话又说男子汉大丈夫要能屈能伸,请问这两句话怎么理解?”“如果一个小伙子跟女朋友吵架了,他应该宁死不屈还是能屈能伸呢?”这样的问题,答案并不是简单的解释,而是针对具体场景做出的非常人性化和合理化的答案。
再比如它能够区分出“今天小明参加比赛获得了冠军,拿到奖杯后他默默地站了一分钟。今天我上课被老师批评了,走出教室后我默默地站了一分钟。请问上面这两个默默地站了一分钟分别表达了什么心情?”这两种不同的心情。而在数学运算方面,星火大模型不仅能够很快准确给出答案, 还能给出解题步骤。
刘庆峰表示,数理能力一定程度代表了一个大模型的聪明程度。除此之外,星火大模型还具备了非常丰富的通识内容,可以就生活中的各类问题甚至包括医疗问题都能给出准确的答案。星火大模型还具备逻辑推理能力与代码能力,讯飞也拿出了一个进化时间表,未来还将进一步升级多模态输入和表达能力,实现自身迭代进化。
从现场的表现来看,在我最近参加的各类大模型的发布会中,讯飞的表现算是最好的也是最务实的,因为各类问题的设置都非常有诚意,专门挑了很多大模型的薄弱环节进行尝试,最后得到的结果也比较精准,尤其是在共情部分和计算能力上显著要超出其他竞争对手。
刘庆峰一再表示要超越ChatGPT的信心也溢于言表,和之前很多创始人的谨慎表现有很大差别。他表示,当前讯飞星火大模型已经在文本生成、知识问答、数学能力三大能力上已超chatGPT,在10月底,星火大模型将彻底实现中文能力超越ChatGPT,英文能力追平ChatGPT。这确实让人非常期待。
四大工具提前落地
当然这场发布会我认为最重头的还是四大工具的提前落地。目前大模型的产品很多,但具体到应用上可能还相对空白,这次讯飞一口气发布了教育、办公、汽车和数字员工4个落地的工具产品,显然在人工智能落地方面走在了前面。
在教育方面,讯飞星火大模型配合讯飞智能学习机可以实现实现中英文作文的类人批改。孩子的作文通过摄像头可以一下子导入学习机,大模型很快就会针对文章的写作要求、全篇结构和文采的深度进行高阶批改,水平甚至超越了一般的语文老师。
而办公方面则结合了讯飞的办公本,升级了会议纪要、语篇规整两大功能,一方面将语音实时转写与墨水屏纸感书写相结合,快速提炼会议纪要。一方面则能去除语音转写文稿中的口语化词汇、过滤冗余词汇,对文本进行润色等,解决录音内容整理问题。大幅降低人力劳动,阅读效率提升可达60%。这个功能对于我来说是常用又高频,解决了文本整理中的最大问题,让我感受到了当年第一次接触到讯飞录音转文字的那种惊喜。这无疑是办公效率的又一次大飞跃。“大模型+讯飞听见”,一段录音、一键成稿, 一分钟输出流畅会议文案,是处理会议内容还是采访演讲,都是真正的神器。
讯飞在汽车领域一直有所深耕,已为数千个车型提供业界领先的智能语音交互服务,大模型的引入和加持则将交互体验提升到一个全新的高度。而“大模型+数字员工”,则基于自然语言生成业务流程和 RPA,帮助企业员工完成大量重复性工作,目前这项工具已经在讯飞内部开始使用了。当然接下来随着产品的不断升级和成熟,还会有更多的工具诞生和落地,人工智能的落地和带来真正的产业升级可以说是指日可待。
所以这场发布会真正不同的地方就在于这个大模型不仅仅可以聊天,而是真正的已经在某些领域开始落地使用了。在之前,讯飞开放平台就已经开放了560项AI能力,并聚集了超过500万生态合作伙伴,而在新增星火认知大模型之后,相信整个讯飞的AI智能开发生态会有一个质的飞跃。刘庆峰也在会上宣布,首批来自36个行业的3000余家企业开发者将接入星火大模型,联合各行业合作伙伴共建大模型“星火”生态。与生态伙伴一起,燎原新一轮产业变革。
在整个发布会的尾声,刘庆峰的一句话似乎揭开了一个新时代的帷幕:“世界的每一次更新,都始于一个提问。”