促进数字技术与实体经济深度融合,已成为近年来最火热的议题之一。ChatGPT的面市又将人工智能大模型推向了高潮。
2023人工智能大模型基准测试科创发展大会暨中西部数字经济大会(下称“大会”)将于12月28日在成都市正式举办。大会旨在为行业发掘出更优质的大模型,并提供资源对接。
大会举办之前,大模型基准评测专家委员会专门为大模型评测研制开发了自动测试平台,取名“OpenEval”,意为开放评测。
对此,专家委员会成员——来自上海交通大学约翰·霍普克罗夫特计算机科学中心的林洲汉教授在接受红星资本局专访时提到,“得益于国内更多样化的应用场景,在应用大模型的方式方法上,国内的大模型落地应用,未来甚至是大概率可以走在美国前面的。”
国内应用场景更多
未来应用大模型的或走在国际前列
红星新闻:2022年底,OpenAI推出人工智能聊天原型ChatGPT,在国内及全球掀起了AI浪潮。能跟我们讲讲AI和大模型的关系吗?大模型是如何形成,如何分类的?
林洲汉:相对于大模型,AI是一个更广泛的概念。但是现在,以ChatGPT为代表的大模型取得重大突破并出圈,AI和大模型也就似乎成了同义词。但实际上,在大模型之外,AI还有很多其他的重要工作。
大模型并非凭空而来。模型结构作为模型训练中的一部分,最早出现在2016~2017年左右,加拿大的蒙特利尔实验室先后做了attention和self-attention两个attention的机制,紧接着谷歌在self-attention的基础上做了transformer。这些模型结构上的前期技术积累,扫清了神经网络在模型结构上走向大规模化的技术障碍。不过当时包括谷歌在内的众多研究机构都只是用这些模型去训练一些只有几十、几百兆的小模型。直到OpenAI将Transformer模型大规模化到175B的程度,模型效果才量变引起质变,有了质的飞跃。
另外一个重要要素是预训练。刚开始,模型训练就是每一个任务对应一个单独的模型,后来慢慢发展成用巨量的语料去预训练,这种训练模式能够利用预训练好的单个模型,通过后期的微调训练,将各种任务统一到一个基础模型上。OpenAI则是利用GPT-3高达175B的大模型,不光彻底统一了绝大部分的自然语言处理任务,还在模型的通用性、对新任务的适应速度等方面做到了全新的高度。做出了指令微调、in-context learning等的新形式。
红星新闻:目前,国内大模型主要应用在什么领域?已经发展到了什么阶段?
林洲汉:在大模型的落地应用方面,其实国内外没有太大的差距。甚至得益于国内更多样化的应用场景,在应用大模型的方式方法上,未来甚至是大概率可以走在美国前面的。
至于典型的应用场景,我可以想到的就是常见的网络会议场景和电商客服场景。大模型可以自动生成会议概要、自动回复客户问题。甚至语言模型也可以接上一些外部的工具。
在基础模型研发方面,目前还没有其他公司的产品能够超越ChatGPT。因此可以说,这不光是中美之间的差距,也算是OpenAI与世界的差距。
医疗问诊、在线教育、办公软件等都会用上大模型
未来各个模态会融合起来
红星新闻:对于我们每天都会接触到的手机软件,哪些运用了大模型?运用的何种大模型?大致原理是什么?
林洲汉:像我前面提到的会议软件,以及办公交流软件,比如飞书、钉钉,大多是会用到大模型的。
另一个典型就是现在的电商服务机器人。我们可以看到,像淘宝天猫这些电商平台,部分店铺的自动回复相较于以往已经明显更智能,并且在售前售后服务方面替代真人客服。这些使用大模型的店铺,会使得用户的交互更智能,真人客服也将更少参与。
另外,在医疗问诊、在线教育等领域也会用到大模型。比如医疗问诊,当患者遇到排号紧张,自身患病不严重的情况就可以选择互联网问诊。
但总的来说,现阶段来看,大模型的应用基本就是“两条路”。一条就是调用OpenAI的ChatGPT,但ChatGPT能够给到使用者的定制化应用相对较少,因为它只能直接输出文本。另一种就是定制化程度更高的私有化部署,这种情况可以选择用开源模型或者合作方自有的模型,在私有领域专门微调定制。
红星新闻:我们了解到,机器学习和自然语言处理这个方向上,有包括机器翻译、聊天机器人等离日常生活很近的应用,目前有没有更新的领域正在开拓?
林洲汉:其实自然语言处理有了像ChatGPT这样的大模型后,相当于给了AI各个领域之间一个互通的通道。目前,大模型可以拓展的领域很多,在往多模态的方向发展,不限于前面的纯文字。比如文生图,图生文,甚至是视频生成等。不过目前视频类还处于起步阶段。
最近,信雅达(600571.SH)因“女儿概念股”受关注,正是基于信雅达实控人郭华强之女郭文景创立了Pika,Pika目前是AI文本生成视频领域的明星公司,可以根据AI模型生成和编辑动漫、电影、3D动画、等不同风格的视频。
所以视频类也是有前景的,未来各个模态或许都会融合起来,可能未来就不存在单独的计算机视觉领域或者自然语言处理领域了。
高级思维活动需要人来负责
AI难以替代
红星新闻:在高校计算机领域科研方面,您认为AI在ChatGPT出现后有什么变化吗?
林洲汉:像ChatGPT这样的大模型出来之后,对于高校科研人员而言,有挑战也有机遇。
挑战是面临科研成本进一步升高。过去小模型对于硬件要求不高,但现在一个模型要跑起来,动辄几十万上百万的机器。
机遇是有了去探讨一些更高更难问题的机会。以往,计算机生成的语言很难保持长篇流畅的文本,更不用去谈事实准确性、语言得体、前后逻辑一致等高级的问题了。现在有了大模型后,我们基本解决了流畅生成长文本的问题,所以可以腾出手来去解决上面提到的更高层面上的问题。甚至可以去考虑模仿专业科学家、律师说话,使用何种专业词汇,以及语言中的前后逻辑等。
红星新闻:随着人工智能应用到各行各业,关于“人工智能是否会代替更多的职业”这样的担忧也越来越多,在这个问题上您怎么看待?
林洲汉:我不觉得替代是一个好的方式,事实上AI也做不到替代。
把AI用到任何一个领域,比如自动驾驶、代替医生问诊、代替记者写稿,AI都没法做到把人替换掉。现阶段,AI只能帮人解决一些脑力上的脏活累活。
以自动驾驶为例,AI能做的就是让车保持在车道内行驶,但是在有交通事故的关键时刻,是需要人介入的。再比如记者写稿,大模型可以帮助记者生成文章内容,但文章的主旨需要人拍板。
因此最重要的一点是,目前高级思维活动还是需要人来决定和负责。
不过,技术的发展很难预知,在未来,AI最终拥有高级思维,实现所谓的通用人工智能(AGI),是完全有可能的。但就目前来看还没有办法做到完全替代人。
红星新闻记者 邓凌瑶
编辑 杨程