2024-03-29 17:53:14 作者:姚立伟
2022年底,大语言模型ChatGPT惊艳亮相,掀起了生成式人工智能的热潮。今年初,Sora模型的发布再一次刷新了人们对AIGC发展速度的认知。毫无疑问,人工智能技术已经成为第四次工业革命中发展速度最快、影响最大的创新之一,但与此同时,它也在安全、治理、监管、版权、伦理等多个方面带来风险和挑战。
人工智能将会带来哪些新机遇?“人工智能+”如何赋能新质生产力?生成式AI如何治理?近日,新华社记者专访了微博COO、新浪移动CEO、新浪AI媒体研究院院长王巍。
微博COO、新浪移动CEO、新浪AI媒体研究院院长王巍
记者:不久前,Sora模型的发布再一次刷新了人们对AIGC发展速度的认知,全球人工智能技术发展日新月异,在节目的开始,首先让我们畅想一下,未来5年,人工智能将会给我们带来哪些改变?
王巍:第一,大模型+类似Sora的视频生成模型有望重塑影视、短视频生态。目前影视创作或者短视频创作以人为主,随着AI能力快速发展,可能会进入一种新的创作形态,比如使用大模型来进行剧本以及分镜头的创作,使用Sora生成分镜头的视频,使用音频生成来自动配语音,这样可以极大降低制作视频成本、提升视频制作效率。目前以人为主的影视及短视频创作生态可能转变为人机结合的形态,人主要负责高创意部分,具体内容生成可以由AI来完成。
第二,AI辅助科学发现有望助推科学事业发展。科学发现是种高智力行为,对于逻辑能力、创造力要求很高,目前主要由经过多年科学训练的科学家来做这个事情。衡量大模型智能程度一个好的标准是AI是否能够独立作出科学发现。随着AI大模型逻辑能力快速加强,未来有望由AI模型辅助科学家甚至AI独立作出科学发现。
著名数学家陶哲轩认为未来10年内,AI能够赶上甚至超越最优秀的数学家。而他自己也经常使用GPT-4辅助做定理证明,并在GPT-4的帮助下成功证明了一个新的数学定理。
去年12月份,谷歌DeepMind实现了数学大模型领域的重要突破,其发布的FunSearch针对诸多历史上经典数学难题给出了新的解法。最近发布的Claude 3在这方面能力也很强,有用户反馈Claude 3在短短几小时给出科研人员用数月才能得出的量子算法研究方案等内容,就体现了Claude 3 为科研领域带来的影响。
这说明使用AI辅助科学发现目前已经具备了可行性,在科学研究领域,利用AI模型分析大量数据、识别模式和生成假设的能力,有助于数学、化学、物理学等领域的科研人员获得更多突破性的科学发现,以更好地推进科学知识的发展。
记者:新浪微博有很多AI大模型方面的实践,请介绍一下最新的进展。
王巍:过去一年我们做了不少AIGC应用,这里分享下新浪和微博在应用大模型的三点实践经验:
第一,如何克服大模型的幻觉问题。我们知道目前大模型或多或少都存在幻觉问题(AI Hallucinations),有时候会随口胡编答案,关于大模型幻觉是否能被解决掉目前是有争议的。有的人认为幻觉是大模型天生就有的一种特性(Feature),不可能从根本上解决;当然也有人认为大模型幻觉是可以通过技术手段解决的。
我们且不论幻觉将来是否会被解决,但在企业应用大模型的时候,这个问题必须要面对。我们对大模型幻觉有两个应用体会:首先,有些比较严肃的场合是不允许出现幻觉的,比如法律相关的问题、企业内部政策相关的问题等。对于这种场景,我们会引入RAG检索增强生成技术,把领域相关的知识放入向量数据库里,让大模型搜索出事实,并在已知事实基础上回答,这可以很大程度上解决幻觉问题。另外,企业应用有很多不同的应用场景,在有些场景,其实我们应该故意利用大模型的幻觉,让它从缺点变成优点。比如微博也会做虚拟角色的应用,在这种应用场景里,其实大模型产生幻觉不但不是坏事情,很可能还是优点,会让用户觉得角色很有趣。
第二,企业内部高质量数据对于应用来说很关键。一般通用大模型是用互联网上的数据训练的,缺乏很多企业应用所需要的领域知识,如果你直接拿来用效果就不太理想。企业内部有很多私有数据,那用来训练大模型,是不是越多越好呢?我们的经验是相对于数量,数据质量更重要。要收集高质量的企业内部数据来训练大模型,哪怕数量不是特别多也不是问题。举个例子,我们做的评论机器人“评论罗伯特”,就从大量微博用户评论数据中精选了一小部分,比如用户点赞比较多的,只用这部分高质量数据训练出的机器人回复质量就很好。
第三,企业应用不一定非要用最强的大模型。我们的第三个经验和第二个有一定关系。如果在做应用的时候,多在数据上下功夫。其实基座大模型并不一定要用最强的或者最大的大模型。我们做了很多应用,背后采用了开源大模型,但是模型规模都不大,一般在6B到13B之间,如果数据筛得好,其实应用效果不比更大的模型差,同时推理方面成本也低得多。所以数据质量还是第一位的。
记者:今年的政府工作报告提出要大力推进现代化产业体系建设,加快发展新质生产力,其中专门提到深化大数据、人工智能等研发应用,开展“人工智能+”行动,打造具有国际竞争力的数字产业集群。您如何理解“人工智能+”?“人工智能+”对培育新质生产力有什么重要意义?
王巍:“人工智能+”是今年政府工作报告中的新提法,从“互联网+”到“智能+”再到“人工智能+”,概念的变化是基于人工智能大模型发展的实质性突破。当下,人工智能加速迈入规模应用的新阶段,从单点应用向多元化应用、从通用场景向特定行业场景细分深入。可以说,它已经不仅仅是从前助力千行百业提质增效的辅助手段,它已经升级成全球科技竞争的焦点,是支撑经济社会数字化转型的不可或缺的生产力,将为经济社会发展带来新的模式和动能,发挥乘数效应,这是我理解的“人工智能+”的要义所在。
“新质生产力”强调的就是以科技创新为核心,推动产业创新,实现社会生产力的新跃升。人工智能对新质生产力的作用可以归纳如下方面,第一,人工智能可以为科技创新提供原动力,正如刚刚提到的,人工智能对基础科学发现的赋能。第二,是人工智能对各行各业的赋能,无论是加快医药创新的研发、提高办公效率、促进教育公平,还是改变制造业生产模式,提升产业国际竞争力等等,人工智能将在垂直领域去赋能,发挥乘数效应。第三,人工智能的发展不仅培养了一批适应数字经济时代的技术复合型人才,还制造了一批智能机器人或者智能助手,这些新兴劳动者的塑造也是其对新质生产力的贡献。
总的来说,新质生产力是推动新兴产业和未来产业快速发展,形成新的经济增长点的关键,而这其中,人工智能无疑起着引擎的作用。我相信,人工智能展现给我们未来的世界将超乎想象。
记者:我们关注到,随着人工智能的发展迭代,生成式AI在提供技术便利的同时,也出现了“深度伪造”诈骗、版权归属模糊等一系列问题,引发了人们对人工智能伦理道德问题的关注和讨论,您如何看待这些问题?
王巍:人工智能伦理方面的问题其实我一直都有关注,而且在之前的一些公开场合也提到过。其实任何新兴技术都具有双刃剑效应,AIGC给我们带来的影响既有正面也有负面。正面影响包括提升信息多样性、创新性,满足信息定制化、个性化需求,优化信息获取体验。负面影响则是加剧用户信息焦虑及压力,增加虚假信息辨识难度。
去年,国内就已经出现了违法者利用编程和AI技术编造的谣言,如果AIGC技术被滥用,未来我们可能会面临一键生成数十、数百则仿真度极高的“新闻”,这就有可能让公众陷入信息恐慌。
另外,比如,AI用以训练的数据本身是否涉及侵权?人机共生创作出的内容版权归属于谁?使用AIGC内容是否会面对侵权风险?这一系列问题目前都有争议,有待在法律中加以规范和界定。比如我之前关注到,艺术家Erin Hanson创作了一幅画作,AI根据他的风格也生成了一张几乎一模一样的。那么我们如何来分辨,这个就非常有难度?目前AI可以惟妙惟肖地模仿艺术家的不同艺术风格,所以,这就带来了相关的版权争议。
因此,我们要特别重视这些问题,用审慎的态度更好地理解、掌握、运用新技术,才能应对新技术发展带来的伦理挑战。
记者:我们看到,从2023年到2024年,大模型的发展越来越快,给各行各业带来了诸多利好,也深度影响着社会经济发展,产业变革。那么,从更具象化一些的角度,生成式AI未来会给我们这些普通人带来了哪些影响呢?
王巍:2023年是AI开始走入我们普通人日常生活的起点,而2024年大模型应用发展已经明显开始提速,而且远超我们的想象。我相信,基于大模型开发出来的应用很快会广泛走入我们的日常生活。大家用大模型的模式会从主动找AI工具,转换成AI应用润物细无声地渗透入我们的日常生活中,也许我们在使用AI但是你可能并没有意识到它的存在,我认为这才是AI最好的应用状态。
未来,我们的“衣食住行”很可能会是这样的:我们在选择衣服鞋子等日常生活用品的时候,AI会根据你的3D形象自动换装,我们能在几分钟之内找到最心仪的服装款式;当我们希望健康饮食的时候,AI会为你设计既满足健康需求又满足营养需要,同时又符合你饮食习惯的一周健康食谱;“智能家居管家”会让你用自然语言轻松控制家里的各种设备,比如自动调节合适的室内温度;出行的时候,我们通过召唤车机助手,可以在行驶中进行导航切换、调节空调甚至是自动驾驶,汽车可以自动感知外部环境变化,比如下雨后自动关闭车窗。我相信这样的场景很快会到来,并影响我们日常生活和工作的方方面面。
不仅仅是日常生活,对于我们的日常精神文化诉求,AI大概率也会无处不在地出现在我们身边。随着AIGC、大模型、数字人、AR、VR的技术日渐成熟,和传统信息消费方式不同,我们会以沉浸式的方式身临其境地感知异地、虚拟的环境与人物。
微博也在努力做一些应用探索让AI更贴近我们普通人的生活,比如“AI创作助手”帮助大V博主产生创作灵感、“AI明星伴聊“搭起了粉丝和偶像的私信沟通桥梁、微博用户可以通过“星座大模型”来聊聊关心的星座情感问题……当然网友可以在发“吃喝玩乐”日常生活相关微博内容的时候@评论罗伯特,这个虚拟机器人就会在你的微博下留下非常有意思的评论,跟你互动。
记者:您能否用一句话来畅想一下AI大模型的未来?
王巍:如果站在10年后回看今天,也许我们正站在智能时代珠峰的山脚下,爬上峰顶注定充满曲折和困难,但除了登顶我们没有别的选择。智能时代已经到来,对于AI大模型,让我们一起欢迎它、使用它、创造它。