当前位置:首页|资讯|深度学习|人工智能

AI掀起新时代,中文大模型如何破局?

作者:巨丰财经发布时间:2023-07-21

原标题:AI掀起新时代,中文大模型如何破局?

编辑|w

摘要:

♦ 随着人工智能在内容创造中的应用日益广泛,AIGC的概念也随之出现。

♦ 技术研发和创新所占资源投入的比例最大(avg34%),是企业保持领先地位的核心驱动因素。

♦ AI企业为了提高效率、规模和竞争优势,将会在AI的各个子行业和产业链的上游和下游进行整合。

大模型军备竞赛,为人工智能开启创新时代

人工智能作为一种新型的战略技术,将在未来的发展中起到主导作用。在上世纪50年代,艾伦·图灵提出了“图灵测试”,用来判断一台机器是否具备“智能”,看它能否模拟人的思考模式,“生成”一些信息,并与人进行交流,从而引起了人们对这一问题的重视;直到二十世纪五十年代中叶,随着电脑的问世和发展,人类才真正开始了对人工智能的研究。随着人工智能在内容创造中的应用日益广泛,由人工智能产生的内容(Artificial Intelligence Generated Content,AIGC)的概念也随之出现。

AIGC的发展大致可以划分为三个时期:

初期(1950年-1990年):由于技术条件的限制, AIGC只能进行很小规模的试验。早在1956年达特茅斯大会上,“人工智能”这个概念便被提了出来,并在短短十几年的时间里,便达到了一个新的高度,大量的研究人员蜂拥而至,并在这一领域取得了令人瞩目的成果。

沉积累积期(1990年-2010年): AIGC由实验到实际应用的过渡。2006年,随着深度学习算法的出现,包括 GPU和 TPU在内的计算设备的性能得到了极大的提高,网络环境下的数据规模迅速扩大,为各种人工智能算法提供了大量的训练样本,使得人工智能的发展得到了长足的发展,但由于算法的局限性,其在实际应用中的局限性和有效性亟待提高。

快速发展阶段(2010年-至今):生成的内容百花齐放,效果越来越逼真,以至于让人无法分辨。2014年以来,伴随着生成式对抗网络(GAN)等深度学习算法的不断涌现, AIGC进入了一个全新的时代。

百亿资本有望进入,资源投资分散化初见端倪

中国人工智能技术企业在技术研发、算力资源投入、数据收集与标注、市场推广与商业化拓展等领域所占比例上的不同,反映出其战略取向与发展侧重点。在人工智能企业中,技术研发和创新所占投入比例最大(avg34%),是人工智能企业保持领先地位的核心驱动因素。

算力投入(avg32%)是人工智能研究与发展的重要基础,而云计算、分布式计算、人工智能芯片等技术是支持大数据处理与模型训练的重要手段阿里巴巴推出的“阿里云”、百度推出的“百度云”、华为推出的“云服务”等,都在积极拓展计算能力,例如,百度推出的百度机器学习(Baidu Machine Learning)平台,阿里云推出的阿里云机器学习 PAI平台,华为ModelArts则是向AI开发者的一站式开发平台。

数据采集与标注则是AI算法训练的关键(avg19%)。一些科技公司利用自身的生态系统进行大量的数据采集,并通过人工或半人工方式进行数据标注。例如百度EasyData智能数据服务平台提供便捷的数据采集方案,丰富的数据标注模板及工具,支持将采集、标注、加工等处理后的高质量数据直接对接至EasyDL、BML等百度AI开发平台,服务于后续的模型训练输出更高精度的模型效果。市场推广与商业化扩展则是AI技术走向市场、实现价值的关键环节。

中国人工智能企业对数据安全和隐私保护高度重视且严格执行,并采取了一系列行之有效的措施:

多重保护措施保证了数据的安全。根据参与调查人士提供的信息,大部分公司都会设置多重防御,以避免数据被非法获取,例如在数据传输时,会采用加密技术。由此可见,中国人工智能企业对信息安全问题的重视程度,以及其强大的技术手段和反应能力。在保证隐私的同时,也要注重动态的处理。根据调查显示,有一半的企业,都会定期检查和更新自己的数据安全和隐私,同时,也会采取严格的脱敏和匿名化措施来处理用户的数据。这种动态的、严格的处理方法在保障数据高效利用的同时,还能有效地保护用户的隐私。以用户为中心,对用户的资料进行安全保障。调查显示,有22%的企业,在获得了使用者的许可后,会建立专业的资料保护小组,以保证资料的安全性和隐私性。用户可以随时查阅、修改、删除个人信息,并能在发生信息安全问题时向用户发出预警。这样的做法,不但是为了遵守法规,更是为了增加顾客对企业的信任。提高员工的安全意识。根据调查,有11%的公司对内部员工进行了数据安全和隐私保护方面的培训,这一举动表明了这些公司对创造安全文化的重视,同时也向员工提供了更好地保护用户数据的安全和隐私所必需的知识和技能。

国家规制干预,需要关注 AIGC的数据安全性

在大规模的训练过程中,需要使用数据安全技术来确保所获得的用户个人隐私信息不会被其它终端所获得,也不会被用于其它用途。在2023年5月10日,国家互联网办公室发布了《生成式人工智能服务管理办法(征求意见稿)》,其中第5条规定,使用生成式人工智能进行聊天、文字、图片、声音生成的,要对生成的内容负责,对生成的内容负责,对用户的隐私负责,对用户的隐私负责。这就对今后 AIGC的内容提出了明确的、稳定的、精确的要求,同时也确保了使用者的隐私。

中文模型迎头赶上,办公生产力率先变革

人工智能应用前景广阔,产业协作范围广、影响广。人工智能已不再只是技术上的一项专利,它的跨产业应用潜力正逐渐被发掘出来。各行各业都在积极寻找与人工智能企业的合作,从而推动产业向数字、智能的方向发展。对人工智能企业而言,加强与各行各业的协作,不但可以拓展其业务模型,拓宽其收入来源,而且可以帮助其更好的了解和适应市场的需要。

产业间的水平与垂直一体化将成为今后发展的一大趋势。人工智能企业为了提高效率、规模和竞争优势,将会在人工智能的各个子行业和人工智能产业链的上游和下游进行整合。由于科技不断进步,市场日趋成熟,产业间的竞争也日益激烈。这一点不但体现在产业中的大企业,更体现在它们和新兴企业的竞争中。

来源:

五矿证券-大模型与算力共振,奇点时刻到来-20230711

天风证券-AI产业人士看大模型发展趋势-20230704

免责声明:以上内容仅供参考,不构成具体操作建议,据此操作盈亏自负、风险自担


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1