当前位置:首页|资讯|ChatGPT|文心一言|百度|OpenAI|文心大模型

当中国遇上ChatGPT 外行看着很热闹 内行方知复刻难

作者:新快报发布时间:2023-02-27

原标题:当中国遇上ChatGPT 外行看着很热闹 内行方知复刻难

毫无意外,ChatGPT一路从国外火爆到了国内。在大家还震撼于ChatGPT的好玩、强大时,中国应该如何应对它的“一本正经的胡说八道”?类ChatGPT技术在中国又将如何演化,成为社会经济发展的助力,以“人机结合”的全新姿态去开创未来呢?

小心踩雷

代注册账号涉嫌非法经营

直接引用涉嫌侵权或违规

去年12月出现的ChatGPT正红遍全球,并成为史上用户增长最快的一款消费类应用。这款聊天机器人可以和用户自然对话,并能回答几乎所有问题,效果十分惊艳。

但必须强调指出的是,所谓惊艳、人性、有趣、狡诈、虚伪等等的评价,都是来自于海外用户和媒体的反馈、报道。通信界人士指出,OpenAI提供的服务应该属于增值电信业务的范畴,如果想进入中国市场,则需要办理增值电信业务许可证,即ICP证。而法律界人士则认为,短期内ChatGPT都不太可能进入中国内地。ChatGPT在对语义的分析中可能会抓取一些涉及到国家安全的信息,同时AIGC(人工智能生成式内容)本身就带有很强的价值传输属性,可能会对价值观和主流观点造成影响,甚至危及国家安全。

这给一些不法分子提供了可乘之机,借ChatGPT热度牟取非法利益。

2月24日,广东省消委会发布消费提示,提醒广大消费者代注册账号涉嫌非法经营,账号可能被收回。

广东省消委会相关负责人表示,随意下载相关App程序或注册账号,存在诸多风险。一是一些App或应用程序可能会收集和滥用用户个人信息数据,侵害用户个人信息安全权;二是虚假的AI语言模型质量差,响应不准确或不恰当,服务质量低,更可能随时关闭跑路,用户售后服务无保障;三是一些虚假应用程序可能包含恶意软件,进而危及用户设备或数据安全。

除此之外,该负责人还指出,“直接引用ChatGPT答案,可能涉嫌侵权或违规。”因为ChatGPT是由大量数据训练出来的语言模型,在训练的过程中会用到受著作权保护的素材,直接引用可能会涉及侵权等问题。即使不侵害著作权,也可能存在学术伦理问题。目前全球已有多家期刊、出版机构禁止将ChatGPT列为论文合著者,多所高校禁止学生使用ChatGPT。

路在何方

中国将如何正确应对ChatGPT?

在2月24日国新办的一场新闻发布会上,有记者提问说,近期ChatGPT在国内引起了广泛的反响,科技部如何看待这种人工智能驱动的技术,从监管方面,科技部有何考量?

科技部高新技术司司长陈家昌称,基于自然语言理解的人机对话是人工智能发展的一个重要方向,ChatGPT最近形成了一种现象级的应用,表现出很高的人机交互水平,表现出自然语言的大模型已经具备了面向通用人工智能的一些特征,在众多行业领域有着广泛的应用潜力。科技部部长王志刚表示,我们国家对于任何一个新的技术,包括AI技术出来以后,在伦理方面都采取了一些相应的措施,对科学技术发展趋利避害,让其更好地发挥出来。

科技部的回应实际上为我国将如何应对ChatGPT技术带来的冲击作出了定调,关键就在各行各业如何趋利避害,让新技术造福社会的同时,防范和限制其负面影响。

日前,北京市经济和信息化局发布《2022年北京人工智能产业发展白皮书》中明确提出支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。另有消息称,监管机构正出手对ChatGPT掀起的概念股炒作降温,多个AI行业龙头由本月8日起陆续收到“监管工作函”。

复刻ChatGPT有多难?

打造对标ChatGPT的大模型为何要政府支持头部企业来干?中国这么多大大小小的科技企业、AI企业不行吗?

从技术角度来看,ChatGPT其本质仍然属于自然语言NLP的范畴,是人工智能技术长期发展和积累的结果。Meta首席AI科学家Yann LeCun评论说:“就底层技术而言,ChatGPT并没有什么特别的创新,许多研究实验室正在使用同样的技术,开展同样的工作。”

大模型的训练离不开算法、算力和数据,算法决定了其本身的学习能力,算力则影响着算法的学习效率,数据决定了AI的训练效果。

关键就在于大模型训练的门槛非常之高。按国盛证券估算,类ChatGPT大模型的训练成本,一次就要烧掉200万到1200万美元,每日电费高达5万美元;摩根士丹利的分析甚至认为,ChatGPT每生成一条资讯都可能会花掉OpenAI 2美分,这大约是Google搜索查询平均成本的七倍。还有研究机构估算出,以日均100万用户为基础估计,ChatGPT每日可能要烧掉10万美元、每月300万美元,而自去年12月至今,其访问用户早已过亿。

由于研发所需资金太大,OpenAI在2019年转变为盈利上限型组织,和微软达成了资本挣到有限收益之后,后续收益归非盈利实体。截至目前,微软对OpenAI最新一轮投资额达100亿美元。

这也是为什么日前原美团联合创始人王慧文在社交平台官宣出资5000万美元,要打造中国的OpenAI,却被网友质疑“5000万美元够干什么”的原因。

2月20日,由复旦大学计算机科学技术学院邱锡鹏教授团队研发的中国首个类聊天机器人ChatGPT模型MOSS发布至公开平台,接受公众内测,不过数小时后就因为访问量过大被网友挤“崩溃”了。

“MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路要走。”复旦研发团队21日发布道歉公告表示,复旦MOSS仅为学术实验室,无法制作与ChatGPT能力相近的模型。MOSS团队核心成员之一的张奇教授曾在一次公开讨论中表示,按照ChatGPT目前开源的最简单复现版本、最便宜模式去计算,要做到其1750亿的参数规模,需要大概6000万元的硬件成本,同时运算3.5个月。这还是所有事情都做对的情况,如中间有参数调整,或者想加速训练过程,就需要更高规模的投资。

到目前为止,国内只有几家科技大厂基本具备训练大模型的能力,比如百度的文心大模型,阿里的“通义”大模型,华为的鹏城盘古大模型,腾讯的混元AI大模型等。

“文心一言”领衔

中国版ChatGPT如箭在弦

2023年2月,知名咨询机构IDC发布了《2022中国大模型发展白皮书》,同时提出了业内首个大模型评估框架。

根据IDC发布的中国大模型市场2022年评估结果,来自百度的“文心大模型”在整个评估中处于第一梯队,产品能力、生态能力、应用能力全面领先。

百度“文心大模型”在过去已经构建了“大模型+工具平台+产品与社区”三层体系,在能源、金融、航天、制造、传媒、城市、社科以及影视等领域,都能展开广泛应用,打通大模型产业落地的关键路径,加速产业智能化。

2月7日,百度官宣即将3月正式上线大模型新项目——文心一言(ERNIE Bot),随后,官宣将接入的重量级企业遍及各行各业。

据记者了解,百度的文心大模型和Open AI的GPT模型类似,在2019年就已经推出,并且已经迭代了多代,从单一的自然语言理解延伸到多模态,包括视觉、文档、文图、语音等多模态多功能,因此“文心一言”所基于的ERNIE系列模型也已经具备较强泛化能力和性能。以最新发布的ERNIE 3.0 Zeus为例,该模型迭代于ERNIE 3.0,拥有千亿级参数,其已经具备智能创作等各类自然语言理解和生成任务,且公开数据集上小样本学习、理解和生成任务效果皆好于业界其他模型。

相比ChatGPT,文心一言能够基于检索增强提升时效性准确性,并基于知识增强提升多轮推理对话。此外,文心大模型是本土化的AI模型,具备对中文甚至中国文化的更深理解,这意味着文心一言会更适合中文和中国市场。

除了百度,多家国内头部科技企业也都对中国版ChatGPT“摩拳擦掌”。

腾讯方面表示,目前在相关方向上已有布局,专项研究也在有序推进。腾讯持续投入AI等前沿技术的研发,基于此前在AI大模型、机器学习算法以及NLP等领域的技术储备,将进一步开展前沿研究及应用探索。

京东则计划结合ChatGPT的方法和技术点,融入到产品服务中,推动人工智能的产业落地。京东集团副总裁、IEEE Fellow何晓冬称,京东拥有丰富的场景和高质量的数据,京东云言犀每天和用户进行1000万次的交互,使得算法能够及时地迭代更新。

有道AI技术团队已投入到ChatGPT同源技术AIGC在教育场景的落地研发中,目前该团队正在AI口语老师、中文作文批改等细分学习场景中尝试探索,将尽快推出相关的demo版产品。

谁能得利

这些行业将从类ChatGPT的发展中受惠

尽管近期多家AI相关公司短期内股价受大量资金追捧而上涨,但多份市场研报都认为,对比此前数次生产力大幅提升时期的情形,赢家很可能是别人。

IDC中国研究总监卢言霞就指出,尽管媒体上掀起ChatGPT的热潮,短期内ChatGPT对市场影响有限,长期来看这些模型甚至在3年以后会退出市场,真正启示一方面在于语言模型的演进推动通用AI的到来;另一方面在于大模型落地推动AI开发范式的转变,促进产业链细分。

中银国际发表研报称,不会低估ChatGPT长远而言所带来的潜在颠覆性,但以目前的用户体验、应用场景、进入壁垒和商业化潜力来评估,未能证明其巨大投资成本是合理的。该行认为,预期拥有数据和资本优势的大型平台公司,将较AI软件企业更能受惠。

而从更长期来看,市场相信,商业与专业服务、软件与服务、制药生命技术与生命科学等脑力密集度较高的产业,与受惠于薪资增长与工时进一步下降的非必需消费类股最可能受惠。

●搜索引擎

ChatGPT给大众带来的最大冲击,很可能就是日常从“万事问百度(谷歌)”转向万事问ChatGPT了。

微软公司已经抢先与OpenAI实验室联合宣布,将把比ChatGPT更厉害的下一代AI技术整合进微软旗下搜索引擎和浏览器。“这项技术将重塑几乎所有软件。”微软CEO纳德拉表示。

百度CEO李彦宏在周末的最新财报电话会议上表示,我们将首先将文心一言功能嵌入到搜索服务之中,并在3月份上线。用户不久后就能够同新的生成式大语言模型进行直接互动,将成为传统搜索体验的一种补充,甚至升级,吸引更多用户。

●金融

美国卡内基梅伦大学电脑科学教授克尼策日前表示,聊天机器人存在很长一段时间了,但它们的能耐从现在起似乎出现了重大变化。人工智能的进步,或许不只代表会把任务自动处理掉并替人类节省时间,也可能取代部分工作,包括四种不同的白领工作:科技工作(程式设计师、软件工程师、数据分析师)、金融工作(金融分析师、个人理财专家)、法律工作(法律助理)、媒体工作(营销、内容创作、技术写作、新闻)

在近日的一场数字金融沙龙上,新网银行首席信息官李秀生展望ChatGPT及类似技术在金融机构的落地时表示,现有的智能客服模式将得到一定优化,“有上下文的连贯性,让客户的体验得到提升。”

不仅如此,在李秀生看来,ChatGPT所具备的文本输出、初级编程等能力,未来在报告输出、代码编写等方面,也有“解放人力”的价值,可以大幅节省初级报告编写人员和初级程序员的工作量。

光大信托数据中心总经理祝世虎表示,“从算法上看,ChatGPT是一种感知智能,不是决策智能,更不是计算智能,这就是ChatGPT的使用边界,它可能不能直接做风险决策,不能直接计算资本,但是它可以感知文本。所以银行的所有流程中跟文本相关的工作,它都能以小助手的身份去切入。”

度小满日前宣布成为“文心一言”首批生态合作伙伴,将基于自身金融场景积累的海量对话及解决方案数据,融合文心一言的能力,打造全新的智能客服、智能营销、智能风控服务。这是国内首批探索“生成式AI”在金融场景落地的公司。

度小满CTO许冬亮认为,“ChatGPT创作自由度高,但是它的自由度太大了,当解决真实场景中的任务时,会造成可控性不足;随着技术的突破,科技伦理治理上也要及时跟上才能规范技术的发展。”

●媒体

2月20日,新快报宣布成为百度“文心一言”首批生态合作伙伴,并将在即将推出的新快报新闻客户端对接“文心一言”。新快报将可优先内测试用“文心一言”,集成“文心一言”的技术能力,与百度在产品研发、标准制定等多个领域展开深化合作,打造联合解决方案,通过技术共享、培训赋能、联合营销等方式,强化竞争力,同时依托智慧互联、创新互联,引领科技科普传媒产业变革与升级。

目前,国内已有多家媒体集团加入百度“文心一言”生态圈,获得该AI技术的“加持”,这也标志着对话式语言模型技术在媒体行业内容生态场景的着陆。

在国外,第一个吃螃蟹的是有“美版头条”之称的数字媒体公司 BuzzFeed,近日其宣布与OpenAI开展合作,将使用ChatGPT辅助网站内容的制作。消息一出,BuzzFeed的股价三天内暴涨300%。

对此,有行业专家认为,分析和解释大量语言的数据讯息,是ChatGPT最擅长的技能。ChatGPT能够比人类更有效、更迅速地完成报告和写作任务,这让一些媒体行业已经开始尝试AI生成的新闻内容。不过,由于内容创作的主题并没有办法完全自动化,因为它牵涉到大量的人性判断,语意问题和情感、文笔的论述,未必是AI能够复制的。

新快报记者 郑志辉 廖木兴

编辑:张依然

校对:马少俊


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1