图片来源:摄图网
近日,智谱公众号发文称,北京智谱华章科技有限公司(以下简称“智谱AI”)今年已累计获得超25亿人民币融资,参与方主要包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构及包括君联资本在内的部分老股东跟投。上述融资将用于基座大模型的进一步研发,更好地支撑行业生态,与合作伙伴一同高速发展。
随着深度学习和自然语言处理等技术的发展,AI大模型在语音识别、图像处理、自动驾驶等领域得到广泛应用。全球科技巨头纷纷投入AI大模型研发,市场竞争激烈。然而,AI大模型面临着计算资源需求大、训练时间长等挑战。因此,优化算法、提高计算效率和降低成本是推动AI大模型市场发展的关键。
——AI大模型是一种新的智能计算范式
超大规模智能模型,简称大模型,是近年兴起的一种新的人工智能计算范式。和传统AI模型相比,大模型的训练使用了更多的数据,具有更好的泛化性,可以应用到更广泛的下游任务中。按照应用场景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图技术也迅速发展,AI内容生成(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。
——预训练大模型成为人工智能领导者的竞争焦点
预训练大模型是人工智能产业发展的必然选择,基于海量行业数据和知识,通过强大算力集群,预先训练基础模型,并结合应用场景的数据和各类需求,通过“预训练大模型+任务微调”的方式,进行“工业化”的高效率开发。开发者利用预训练大模型,只需要少量数据,就可以快速开发出精度更高、泛化能力更强的行业模型。预训练大模型可以提升人工智能项目开发效率,降低研发成本,缩短研发时间,解决人工智能项目碎片化的问题。
根据Omdia的数据,中国开发者对基于昇思MindSpore打造的盘古NLP大模型最感兴趣。首先,盘古NLP大模型在技术上处于领先地位,千亿参数模型,学习了40TB的中文文本数据,在中文领域有天生优势;其次,盘古NLP大模型可覆盖多个场景下语言处理的任务和需求,泛化能力强,在知识问答、知识检索、知识推理等文本生成领域有广泛应用前景;另外,盘古NLP大模型对开发者友好,可以让开发者能用拖拉拽的方式使用大模型,开发和生产成本低。这也从另外一个角度验证了盘古大模型的开放性,开发者可以跨平台快速调用盘古大模型,与其他工具和应用结合使用。
——华为Mindspore支持超大规模模型训练开发
在支持超大规模模型训练开发方面,TensorFlow、PyTorch得分较高,而MindSpore已在中国本土框架中处于领先地位:TensorFlow有了JAX这一新生框架的融入,给业界带来更多期待;PyTorch依托第三方并行算法库大模型能力显著提升;MindSpore拥有业界领先的并行算法库,具备原生支持大模型的能力,吸引了广泛的开发者。
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,AI大模型百花齐放的现象表明了一个趋势,即生成式AI在未来可能会对产业结构以及社会带来深刻的影响。现在只是刚刚拉开帷幕,AI对产业的渗透正在加深。毋庸置疑的是,生成式AI将推动全球生产力革新与商业模式重塑。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《》。
同时前瞻产业研究院还提供、、、、、、、、、咨询等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。
更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。