当前位置:首页|资讯|人工智能|OpenAI|ChatGPT|Whisper

未雨绸缪防“卡脖子” 中国需要有自己的大语言模型

作者:东方网发布时间:2023-03-03

原标题:未雨绸缪防“卡脖子” 中国需要有自己的大语言模型

日前,人工智能公司Open AI在其官方博客宣布,公司将开放ChatGPT和Whisper的模型API.API又称API接口,即指软件设计中,调用某一程序所需的预先定义的指令。

这一消息出来后,不少人都认为这是个大利好。毕竟,ChatGPT所表现出的智能程度,打开了许多人的想象空间,接入ChatGPT后的商业前景,让许多AIGC(人工智能生成内容)创业者、个人开发者摩拳擦掌。

然而,有一个不容忽视的问题:ChatGPT出来了,代表着大模型应用的广阔前景。但是,我们是不是依然走只追逐应用开发的老路?中国需不需要自己的ChatGPT?

这个话题也引起了一些政协委员的关注。比如,全国政协委员、天娱数科副总经理贺晗指出,中国科技企业目前更多注重实际场景运用,这与经济发展阶段有关,当下中国有大量的传统行业需要迅速借助数字化实现生产力提升。但长远来看,底层技术能力的欠缺会限制产业数字化的发展空间,甚至,类似ChatGPT大规模预训练模型本身也会成为“卡脖子”技术;全国政协委员、致公党上海市委会专职副主委邵志清在谈到ChatGPT的国产化问题时表示,我国在底层技术突破,也就是科技自立自强还有很多路要走。

的确,考虑到ChatGPT的管理权并不掌握在我们手中。未来如果AI技术大规模普及,深入到了千家万户,如果我们只能用外国的AI,那么就等于是把命脉交到了别人手里。因此,中国必须开发自己的“ChatGPT”,否则在未来很可能陷入被动局面。只有拥有国产自主的“ChatGPT”,我们才能既保证中国社会可以享受到AI产业带来的技术升级,又能够免于被人卡脖子以及无法管理的问题。就像河南省政协委员、麒麟合盛集团创始人李涛说的,“我们需要认识到,以ChatGPT为代表的人工智能技术也是‘硬科技’,必须在国家层面上升到和芯片产业同等重要的地位和高度。”

而且,从技术端来看,目前市场上可见的大模型(LLM)例如ChatGPT的基础模型GPT-3.5基本都是英语为母语训练的,中文基准的自然语言处理的效果未必尽如人意,比如有人问“贾宝玉到底适合《红楼梦》里哪一位女性?”时,ChatGPT果断推荐了贾母——并且煞有介事地给出了自己的理由。如果模型是以中文为基准训练的、更加本土化的,那用户的体验度会提升很多。

近日,百度宣布,“文心一言”将于3月16日面世。该消息一经宣布就引起了巨量围观,而在此之前,已经有数百家企业宣布加入“文心一言”生态。对于这一中国自己的ChatGPT,大家充满期待。

当然,期待是要有的,差距也是需要正视的。毕竟,现在的ChatGPT,参数量已经达到了1750亿,数据量45TB。这些都是在巨额的前期投资和漫长的时间投入下实现的。

大模型训练需要研发者具有“十年磨一剑”的决心和“坐冷板凳”耐心,也需要他们有“超越当下”的格局和魄力,其成功并非在一朝一夕。其实,我们要庆幸,不管怎么说,我们还有“文心一言”,就算它可能不够完美,但它已经在多年积淀的基础上,迈出了第一步。这一步对每一个中国人来说,都是值得欣慰的。

而且,我们有统一的大市场、丰富的应用场景和数据源,还有优秀的算法工程师。相信有了第一步之后,在如此优良条件下,中国自己的ChatGPT会快速成长,未来也必然会更加强大。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1