当前位置:首页|资讯|人工智能|AI大模型|金融|融资|ChatGPT

【高端访谈】西南交通大学计算机与人工智能学院博导冯力:AI大模型赋能金融领域,还需在“最后一公里”做好适配

作者:金融投资报发布时间:2023-04-21

原标题:【高端访谈】西南交通大学计算机与人工智能学院博导冯力:AI大模型赋能金融领域,还需在“最后一公里”做好适配

【高端访谈】西南交通大学计算机与人工智能学院博导冯力:AI大模型赋能金融领域,还需在“最后一公里”做好适配

本文共3324字

阅读完约6分钟

金融投资报记者 刘敏

今年以来,围绕ChatGPT的人工智能话题掀起了一轮又一轮热潮,引起了学界、行业和投资市场的广泛关注。

那么,ChatGPT是如何掀起科技革命热潮的?人工智能技术未来将如何赋能金融领域?金融投资报记者就此专访了西南交通大学计算机与人工智能学院研究员、博导冯力。

冯力

西南交通大学

计算机与人工智能学院研究员、博导

记者提问

ChatGPT的横空出世是否能算作人工智能领域的标志性事件?

冯力:自去年11月面世以来,ChatGPT的每一次迭代发展都备受关注,最新发布的版本是ChatGPT-4,近期有消息称ChatGPT-5将于2023年12月发布。

首先,我们要搞清楚ChatGPT究竟是什么。ChatGPT是美国OpenAI公司开发的聊天式自然语言生成模型,即通过大量的数据训练了各个阶段的模型,它以对话方式与人类进行交互,能够回答多轮问题,客观承认错误,质疑不正确的提问和拒绝不适当的请求。

事实上,人工智能模型分为大模型和小模型,由于小模型用特定领域有标注的数据训练,通用性差,换到另外一个应用场景中往往不适用,需要重新训练。同时,小模型的训练方式基本是“手工作坊式”,调参、调优的工作太多,需要大量的AI工程专业人员来完成。

大模型本质是“通专结合”的两阶段训练,通过大量增加无标识的训练数据,极大地降低数据处理成本,提高效率和精度,“精调”可以灵活适应各种应用场景。

GPT就是一种生成式预训练人工智能智能大模型,重点强调文本等生成能力。而ChatGPT语言的种类、行业、层次、范围、数量、规模均实现了革命性突破,人类全面进入“大语言模型”时代。

记者提问

ChatGPT为何爆火,它和其他聊天机器人在技术上有哪些区别?

冯力:ChatGPT本质是一种智能聊天机器人模型,其交互界面简洁,只含一个输入框,但有聊天内容分类管理,并将根据输入内容进行回复,并允许在一个语境下持续多轮聊天。它的交互方式类似于微信,不同的是微信是人与人之间的通信,而ChatGPT是人与机器之间的通信。

最大的区别在于,GPT实现了从图像、语音到文字智能认知的飞跃。

在图像学习领域,2015年,微软提出的深度学习算法在Imagenet2012数据集中将分类错误率降低到4.94%,首次超越人眼的5.1%;目前深度学习可以达到99.47%的识别率。在语音学习领域,2017年,微软语音识别系统的错误率由5.9%降到了5.1%,超越了专业速记员的水平。而在自然语言处理领域,其具备分类、匹配(比如检索)、翻译(单轮对话)、结构化预测(语义分析)、序列决策(多轮对话)五类功能,同时也使之面对任务繁多、数据和模型不完全相同、特定任务需要大量的标注数据、标注难度大等难题。

虽然缺乏大规模的标注数据,但GPT可以从浩如烟海的文本中轻易获取大规模的无标注文本数据,如果能够有效利用,就能大幅提升自然语言处理的性能,而预训练语言模型就是通过对“无标签”数据进行“预训练”,得到比较好的语言表达,再进行二次专业任务数据的“精调”,最后再应用。

记者提问

都说ChatGPT还可以胜任许多职业,那么ChatGPT和人脑相比谁更胜一筹?

冯力:从理论上来说,人脑大约有1000亿个神经元,能耗大约20瓦;chatGPT3则有大约1750亿个参数,能耗大约为1兆瓦。从计算速度来看,人脑神经冲动速度大约1米/秒,思考速度大约每秒钟几千个操作;而chatGPT3针对不同任务具体而言,每秒钟能够执行数万亿次浮点运算。

两相比较来看,虽然人脑和ChatGPT3都包含大约1000亿个神经元,但它们的结构和功能有很大区别。人脑由大量的神经元和突触组成,能够执行高度并行的计算任务,同时具有强大的学习和适应能力,但计算速度和处理能力相对较低。

相反,ChatGPT3是一种基于人工神经网络的计算机程序,能够在非常短的时间内处理大量的数据和信息,但其智能程度仍然有限,缺乏真正的智能和自主学习能力。

记者提问

在业界看来,未来人工智能大模型的发展应用趋势如何?

冯力:从大模型开发现状来看,与国内大模型相比而言,除了数据、算力与算法构筑起强势技术壁垒,经OpenAI多年打造的底层平台、分布式训练架构、加速算法训练基础设施等,亦是难以超越的大模型训练底层基础。

目前国内技术水平、规模大小差距太大,如果要追赶并生产出类ChatGPT产品,首先要有高性能基座模型,再在基座模型上优化。

根据2021-2026年中国AI软件及应用市场规模预测来看,新的商业业态为“大模型+”,整体呈现IT巨头掌握大模型,小企业利用大模型。也就是说,大模型能力将集中在IT巨头手中,小企业的机会在于前端应用。大模型的开发需要巨额硬件、人力与时间投入,而上述资源往往被IT巨头掌握。小企业的机会在于可以基于大模型的能力进行迁移学习,生成针对自身应用场景的小模型,将模型能力进行行业落地。

具体来看,大模型开发终端应用或插件的形式可以大致分为三类,即大模型以API形式接入其他应用平台、自研大模型生成AI产品以及研发并出售大模型。其中,第三方平台以API形式接入大模型功能,通过接口接入实现主要功能和业务逻辑。目前已公开的信息显示,有超过650家企业宣布接入了百度“文心一言”。

记者提问

chatGPT的出现带来了哪些新的网络安全问题?

冯力:目前安全人员已发现网络攻击者使用ChatGPT来开发恶意软件。尽管ChatGPT的设置阻止其直接做恶,但多个研究人员已经找到方法,能绕开和规避ChatGPT为防止滥用而设置的规则。

威胁情报公司RecordedFuture的研究人员在最新报告中表示,使用ChatGPT编写用于网络攻击的恶意软件代码,降低了攻击者的编程或技术能力门槛。也就是说,这个技术如果被不法分子利用,就有可能让普通人成为黑客,让初级黑客变为高级黑客,网络安全就面临着新的问题。

另外,由深度学习算法生成的深度伪装视频也引起了广泛关注,深度造假技术可以用于高真实感的面部操作。比如使用各种人工智能模型创建独特的自定义内容,让你在预先录制的视频中对人脸进行动画处理、生成图像或交换人脸。到目前为止,互联网上流传着大量深度造假视频,其中大多数针对的是名人或政客。这些视频经常被用来损害名人的声誉,引导舆论,极大地威胁着社会稳定。

记者提问

从应用角度来看,chatGPT能否赋能金融领域?

冯力:财富管理是金融科技最大的增长点,chatGPT的诞生对金融科技可能产生三方面的影响。

一是改变线上化-数字化-智能化发展路径,并提高发展速度。由于ChatGPT类人机交互会产生新的用户数据,智能化可能反向推动数字化,加速数据的闭环迭代。

二是突破财富管理的投顾瓶颈。财富管理是金融科技最大的增长点,第三方财富管理(含保险在内的大理财)最大的痛点是投顾服务线上化,而投顾服务线上化的难点是用户交互。ChatGPT为用户交互体验大幅提升提供了可能性。

不过其中也存在风险因素,包括人工智能发展不及预期,美国限制英伟达、AMD出售高性能GPU导致算力受限,美国制裁导致OpenAI等公司拒绝向中国企业开放API,财富管理行业竞争加剧等。

要知道ChatGPT大语言模型(LLM)并不是万能的,对金融专业领域没办法即插即用(plug and play)。虽然具备出色的自然语言理解能力,类似“空脑袋”和“理解能力高超的门外汉”。chatGPT能理解问题,但专业知识储备跟不上,很多时候只能胡编瞎造,也就是随机生成虚幻答案。

要想真正用好GPT,还需要专业领域在“最后一公里”做好适配,专业垂直领域AI公司要补上。思路是对接GPT和我们本身的金融大数据库,对大模型做1%的微调(Fine Tune),通过垂类训练让GPT能充分理解金融专业领域的相关知识,或结合金融知识图谱,从而在每次回答问题时,都能给予用户正确靠谱的答案。

嘉宾简介

冯力

西南交通大学计算机与人工智能学院研究员/博导,军事智能中心主任,人工智能拔尖班首席导师,西安交通大学博士/博士后,西南交通大学引进高层次人次。华中科技大学、中国地质大学客座教授,ACM/IEEE/CCF高级会员,微软亚洲研究院访问学者。

编辑|贺梦璐 校检|袁钢审核 | 苗曦

本文为|金融投资报jrtzb028( 微信号 )

未经授权,禁止转载 如需转载,请联系金妹儿

转载须在正文开头显著位置

注明稿件来源及作者名,违者必究

互联网新闻信息服务许可证号51120180008


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1