当前位置:首页|资讯|ChatGPT

为什么我们要有自己的ChatGPT?|动察

作者:动点科技发布时间:2023-02-11

为了不陷入被动局面,并且持续享受AI产业技术升级带来的福利,国内打造自己的ChatGPT很有必要。

文|动点科技

作者|黄尘

编辑|李瑞子

本文预计阅读时长12分钟

近期,在ChatGPT的热潮席卷之下,已经有数家公司官宣了自己要做ChatGPT或与其相关的消息,其中,一些公司确实长期深耕AI领域,并有一定的技术积淀;也有一些公司借机炒作和玩噱头,希望能短暂提升股价或者转移视线(往往是经营不善)。

从2020年开始,业界认为AI产业已经进入泡沫期,具体的落地愁坏了一众技术不深而烧钱不止的公司。这样的背景下,ChatGPT的兴起让整个AI产业看到了一丝希望。即便此前已经有比较智能的虚拟助手出现,但是ChatGPT展现出来的知识储备广度和灵活应答水平,都令所有的智能助手汗颜,并且已经有了无数值得期待的未来应用场景。

跃跃欲试的国内企业

从互联网到科技再到金融,准备加入这场战役的中国企业已经卯足了劲,不仅为了股价,可能还为了能够在未来有故事可讲。

· 百度

百度正在打造中国版的类ChatGPT项目——文心一言(ERNIE Bot)。百度在人工智能四层架构中,有全栈布局。包括底层的芯片、深度学习框架、大模型以及最上层的搜索等应用。而文心一言,位于模型层。百度方面称目前该产品在做上线前的冲刺准备工作,预计三月份完成内测,面向公众开放。

· 阿里

有记者从阿里巴巴处获悉,阿里版聊天机器人ChatGPT正在研发中,目前处于内测阶段。此前,有媒体报道,阿里达摩院正在研发类ChatGPT的对话机器人,从曝光截图来看,阿里巴巴可能将ai大模型技术与钉钉生产力工具深度结合。据悉,阿里版本的ChatGPT的对话机器人将和钉钉深度结合。

· 小米

小米方面表示:在ChatGPT领域有丰富落地场景,未来将加大相关领域人力和资源投入。

知情人士透露,小米在ChatGPT领域有丰富落地场景,包括小爱对话、机器人等,其中小爱拥有庞大数据支撑,会让小米在大模型方面进展更迅速。据悉,此前小米在AI大模型上已有多路并行尝试,未来将加大相关领域人力和资源投入。

· 京东

京东计划结合ChatGPT的方法和技术点,融入到产品服务中来,推动人工智能的产业落地。京东集团副总裁、IEEE Fellow何晓冬表示,京东是加速AIGC & ChatGPT规模化落地的最佳场景。他称,京东云旗下言犀人工智能平台已聚焦文本、声音、对话和数字人生成等四方面开展工作,将借助ChatGPT等相关技术成果加速我国人工智能领域的应用落地。何晓冬介绍,在文本生成、语音生成、对话生成、数字人生成方面,京东均已开展了相关工作。

· 网易有道

有道AI技术团队已投入到ChatGPT同源技术(AIGC)在教育场景的落地研发中,目前该团队已在AI口语老师、中文作文批改等细分学习场景中尝试应用。公司有望尽快推出相关的demo版产品,该产品的面世将标志着AIGC技术在国内互联网教育场景的首次着陆。

· 腾讯

腾讯方面表示,目前在相关方向上已有布局,专项研究也在有序推进。腾讯持续投入AI等前沿技术的研发,基于此前在AI大模型、机器学习算法以及NLP等领域的技术储备,将进一步开展前沿研究及应用探索。

据内部人士介绍,产品侧腾讯已推出混元AI大模型,完整覆盖NLP(自然语言处理)、CV(计算机视觉)、多模态等基础模型和众多行业/领域模型。腾讯表示,随着AIGC兴起,未来混元AI大模型会不断推进在文本内容生成、文生图等领域的持续升级。

· 360

2月9日,360在股票交易异常波动公告中指出,公司目前在类ChatGPT、文本生成图像等技术在内的AIGC技术上有持续性的研发及算力投入,但截至目前,所形成的全部成果均仅作为公司内部自用的生产力工具使用,公司的类ChatGPT技术的各项指标只能达到略强于GPT-2的水平,与当前的ChatGPT相比尚有代差的落后。

当天,360创始人周鸿祎在与搜狐创始人张朝阳对话时,首次谈到ChatGPT。他直言,如果企业搭不上ChatGPT这班车,很可能会被淘汰。同时他指出,“做搜索引擎的企业最有机会参与研究类ChatGPT的产品,360肯定不会放弃对这门技术的研究和跟踪。”

· 涂鸦智能

据了解,全球化IoT开发平台服务商涂鸦智能也即将推出智能家居和智慧商业场景下的ChatGPT应用,并将于近期发布Demo。

涂鸦技术团队已经初步完成ChatGPT与自身AI模型的结合和拓展,通过引入ChatGTP强大的语言处理能力,进一步提升智慧家庭和垂直行业的数字化水平。值得注意的是,涂鸦新应用后续或可接入谷歌发布的以LaMDA大模型为基础的Bard对话服务。

· 蓝色光标

蓝色光标在互动平台表示,公司正在积极试用ChatGPT技术,自有虚拟人苏小妹已经介入了AI多轮对话,AI作诗能力已经进入技术测试阶段,未来会结合AIGC和终端交互做更多数字化拓展;同时,公司也在做其他ChatGPT产品的试用和调试。

· 科大讯飞

科大讯飞表示,ChatGPT主要涉及到自然语言处理相关技术,属于认知智能领域的应用之一,公司在该方向技术和应用具备长期深厚的积累。科大讯飞Al学习机将成为公司类ChatGPT技术率先落地的产品,并于今年5月发布。

· 奇安信

奇安信人工智能研究院正基于ChatGPT相关技术和自身安全知识和数据,训练奇安信专有的类ChatGPT安全大模型。未来将广泛应用于安全产品开发、威胁检测等领域。

· 江苏银行

该行已尝试运用ChatGPT技术提升软件开发生产力,进一步提高科技运营效能。“从测试结果看,代码在生产环境运行,完美完成全部需求且仅耗费了不到1小时,不仅编写功能的时间大大缩短,而且原先需要与厂商对接沟通耗费的时间也由数天缩短到了数小时。”江苏银行信息科技部相关负责人表示。“未来的软件开发可能会发展成为AI编写、专人审核的模式,实现生产力的大幅度飞跃。”

相关负责人表示,该行会将ChatGPT新技术进一步融入到日常办公、风险评估、客户服务、辅助营销等领域,更快满足客户在不同场景下的金融需求。

除了上述企业,像汉王、寺库、水滴公司、熵基科技、梦网科技、天地在线、佳创视讯、凡拓数创等也官宣了向ChatGPT发力的计划,然而更多的是蹭热点,并没有太多实质上的技术积累。

打造本土化ChatGPT的必要性和可行性

李彦宏曾在2023年初的内部大会上评论ChatGPT和AIGC:“技术能做到这一步了,但是它会变成什么样的产品,产品能满足什么样的需求,这个链条上还有很多不确定性。”

据国盛证券研报,在ChatGPT智能、顺滑的沟通体验背后,其有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面,GPT-3.5在微软Azure AI超算基础设施(由英伟达V100 GPU 组成的高带宽集群)上进行训练,总算力消耗以每秒一千万亿次计算,约运行3640个整日。

成本上小冰CEO李笛举了一个例子:若用ChatGPT的方法,以小冰框架当前支撑的对话交互量计算,每天成本将高达3亿元,一年成本超过1000亿元。

即便如此,业界还是普遍认为国内也要有自己ChatGPT。不是炒概念,而是真正践行相关技术,迭代模型。星图比特CEO 张炯认为中国打造自己的ChatGPT,有三个方面的必要性:

“第一是市场端,目前ChatGPT对国内用户不开放,国内用户没法像海外用户一样随心所欲的使用,而从市场层面必然会有一个中国的ChatGPT出现。第二是技术端,目前市场上可见的大模型(LLM)例如ChatGPT的基础模型GPT-3.5基本都是英语为母语训练的,中文基准的自然语言处理(NLP)的效果还是稍逊于英语基准的,所以有个中文基准的模型出现会进一步提升用户效果。第三是数据安全,AI的内容生成本身是基于大量数据训练的结果,并OpenAI已经逐步从一个公益性的项目向市场化转变,未来出于利益等因素可能存在不确定性,还有就是中国大陆要求所有的数据都是本地化保存,这点OpenAI在国内没有团队,数据的本地化保存和维护就很难达到监管要求。”

尤其是第三个方面,理论上讲,ChatGPT不会主动训练新数据,鉴于训练数据的过程,ChatGPT可能会回答带有种族歧视、性别歧视或其他不当言论,如果有人蓄意将ChatGPT这样的产品用在干扰舆论、挑动社会情绪上,存在潜在的社会风险。

假如我们没有自己的ChatGPT,就无法控制用来训练模型的数据的所有者和种类,无法在后续通过算法和训练数据进行纠正,大量虚假数据的存在,也给知识产权和社会问题的追责带来了极高的难度。

未来如果AI技术大规模普及,我们跟国外AI大模型的代差拉大到不得不用的时候,那么在ChatGPT上也将面临类似芯片的卡脖子局面。为了不陷入被动局面,并且持续享受AI产业技术升级带来的福利,国内自己打造ChatGPT很有必要。

对于中国自研类ChatGPT产品的发力难点,张炯告诉动点科技:“目前中国大规模应用的聊天机器人与NLP的子任务相关,如机器翻译、智能客服、问答系统等。随着LLM的发展,中国也将普及基于LLM的AI聊天机器人。”

他认为中国自研的聊天机器人在应用上至少需要满足以下要求:首先在交互层面机器人需要适配中文习惯的表达方式,也就是说要理解人类表达的命令。另外,在沟通阶段,为了达到无障碍沟通,机器人需要熟悉中国历史文化等相关的知识,并且使用中国语言风格和表达习惯进行交流,比如同一个词语在不同语境下表达不同的意思和情感。再者,聊天机器人需要根据中国的用户需求和社会现状提供个性化的服务,比如中国特有的支付方式、民族习俗等。

由于国内对AI技术尤其是大模型和相关芯片算力的投资规模以及底层技术还远不如美国,因此想要在短期内达到OpenAI的水平并不容易。

不过长远上看,国内有优秀的算法工程师、统一的大市场、丰富的应用场景和数据源,而且张炯也直言做好中国的ChatGPT并不是没有机会。“大数据方面中国走的很远,国内的各类场景信息化程度都很高,数据源丰富,并且相关的产业链也完整。但模型方面就略显不足,目前像ChatGPT的基础GPT-3.5这样的都是大模型,大模型前期投资大、见效慢,在以前对国内的投资者来说就不是优选的标的,所以只有少数大型互联网公司会参与,但投资也是有限的,进展缓慢。不过这也是机会,我相信ChatGPT这一波对国内的产业投资者也好,互联网公司也好都是警示,之后应该会迎来更大的投入。”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1