当前位置:首页|资讯|微软|OpenAI|ChatGLM

360宣布与智谱AI联手研发中国版“微软+OpenAI”

作者:科技时坛发布时间:2023-05-16

原标题:360宣布与智谱AI联手研发中国版“微软+OpenAI”

速览

360和智谱AI达成战略合作,共同研发千亿级大模型“360GLM”,参考“微软+OpenAI”的合作模式。

智谱AI的GLM和ChatGLM是国内最先进的开源大模型,无论是参数还是性能都在中文语料下保持领先。

360从专注于自己研大模型转而选择了看似更快的“高速商业化之路”,上线360AI商店,拓宽AI应用可及性。

生态正成为各大龙头公司争相布局的重心,360看起来也正走向相同的生态之路。

正文

人工智能(AI)是当今科技领域最热门的话题之一,也是未来社会发展的重要驱动力。随着计算能力、数据量、算法等方面的突破,AI技术不断刷新人类认知和想象,尤其是基于大数据和深度学习的生成式AI(AIGC),更是引发了一场革命性的变化。

生成式AI的核心技术之一就是大模型(Large Language Model),即利用海量的语料数据训练出具有强大语言理解和生成能力的模型。

目前,国际上最知名的大模型之一就是OpenAI开发的GPT系列模型,其最新版本GPT-4于2023年3月15日发布。GPT-4不仅可以接受文字输入,还可以接受图像输入,并且支持文字与图像的混合输入。GPT-4被认为是目前最接近通用人工智能(AGI)的模型之一。

微软作为OpenAI的重要合作伙伴,也在积极利用GPT-4技术开发自己的产品和服务。2023年3月16日晚,微软宣布其正在将人工智能( AI )技术植入到办公软件中,并将其功能命名为Microsoft 365 Copilot。

Copilot可以在微软的多个商业应用程序中使用,包括Word、PowerPoint、Excel等,根据用户的自然语言提示,创建出所需的文档、表格、幻灯片等。Copilot还可以与用户进行多轮对话,根据用户的反馈和需求,调整和优化生成的内容。

在国内,也有一些企业在积极探索大模型技术的应用和创新。其中最引人注目的就是360和智谱AI的战略合作。2023年5月14日,360宣布与智谱AI达成战略合作,共同研发千亿级大模型“360GLM”,参考“微软+OpenAI”的合作模式。

360GLM将基于智谱AI的开源大模型GLM和ChatGLM,结合360在网络安全、搜索引擎、浏览器等领域的海量数据和算力资源,打造一个具有强大中文理解和生成能力的大模型。

智谱AI是清华大学人工智能研究院旗下的科技公司,致力于人工智能大模型的研发和应用。智谱AI的GLM和ChatGLM是国内最先进的开源大模型,无论是参数还是性能都在中文语料下保持领先。

GLM是一个通用语言模型,可以处理多种自然语言任务,如文本分类、命名实体识别、阅读理解等;ChatGLM是一个对话语言模型,可以处理多种对话场景,如闲聊、问答、任务等。

360从专注于自己研大模型转而选择了看似更快的“高速商业化之路”,上线360AI商店,拓宽AI应用可及性。

360AI商店是一个面向企业和个人用户的AI服务平台,提供了包括文本生成、图像生成、音频生成、视频生成等多种生成式AI服务。用户可以通过简单的注册和支付,就可以调用360AI商店提供的API接口或者在线体验生成式AI服务。

生态正成为各大龙头公司争相布局的重心,360看起来也正走向相同的生态之路。360表示,将与智谱AI共同打造一个开放、共赢、创新的AI生态圈,吸引更多的开发者、企业、机构加入,共同推动生成式AI技术在各行各业的广泛应用和创新。

知识延伸

一、生成式AI技术简介

生成式AI技术是指利用人工智能技术生成内容的过程,包括文本、图像、音频、视频等多种形式。生成式AI技术可以实现从无到有、从有到多、从多到优等多种功能,为各行各业提供了无限的可能性。

生成式AI技术的核心之一就是大模型(Large Language Model),即利用海量的语料数据训练出具有强大语言理解和生成能力的模型。大模型通常采用深度神经网络(DNN的基本结构中,我们提到了深度神经网络是利用深度神经网络(Deep Neural Networks,以下简称DNN)是一种基于大数据和深度学习的生成式AI技术,它可以利用海量的语料数据训练出具有强大语言理解和生成能力的模型。那么,什么是深度学习呢?什么是深度神经网络呢?它们和传统的神经网络有什么区别呢?

二、深度学习和神经网络

深度学习是一种机器学习的技术,它是指使用多层非线性变换对数据进行特征提取和表示学习的方法。深度学习的目标是让机器能够从数据中自动学习到有用的信息,而不需要人为地设计特征或规则。

神经网络是一种模拟生物神经系统的计算模型,它由大量的简单处理单元(神经元)组成,通过连接权重(参数)来传递信息和信号。神经网络可以用来进行分类、回归、聚类、降维等多种机器学习任务。

深度神经网络是一种具有多个隐藏层的神经网络,它可以利用多层非线性变换来实现复杂的函数拟合和特征抽象。深度神经网络可以分为多种类型,根据不同的结构、输入、输出和任务,常见的有全连接神经网络(Fully Connected Neural Network, FCNN)、卷积神经网络(Convolutional Neural Network, CNN)、循环神经网络(Recurrent Neural Network, RNN)、生成对抗网络(Generative Adversarial Network, GAN)等。

深度神经网络和传统的神经网络相比,有以下几个区别:

深度:深度神经网络通常具有更多的隐藏层,从而能够表达更高层次的抽象特征,而传统的神经网络通常只有一层或几层隐藏层。

参数:深度神经网络通常具有更多的参数,从而能够拟合更复杂的函数,而传统的神经网络通常具有较少的参数,容易欠拟合。

训练:深度神经网络通常需要更多的数据和计算资源来进行训练,而传统的神经网络通常可以在较少的数据和计算资源下进行训练。

性能:深度神经网络通常在各种复杂的机器学习任务上表现出优异的性能,而传统的神经网络通常在简单或线性可分的任务上表现良好。

三、360和智谱AI合作研发“360GLM”

360和智谱AI合作研发“360GLM”的目标是打造一个具有强大中文理解和生成能力的大模型,参考“微软+OpenAI”的合作模式。这个合作模式主要包括以下几个方面:

数据:360和智谱AI共享各自在不同领域收集和整理的海量数据,共同构建一个高质量、高覆盖度、高多样性的中文语料库,为大模型的训练提供数据基础。

算力:360和智谱AI共享各自在不同平台和芯片上的算力资源,利用分布式训练、模型压缩、混合精度等技术,提高大模型的训练效率和推理速度。

模型:360和智谱AI共同研发“360GLM”,基于智谱AI的开源大模型GLM和ChatGLM,结合360在网络安全、搜索引擎、浏览器等领域的技术积累和场景需求,打造一个具有强大中文理解和生成能力的大模型。

应用:360和智谱AI共同探索大模型在各行各业的广泛应用和创新,包括文本生成、图像生成、音频生成、视频生成等多种生成式AI服务,以及智能搜索、智能写作、智能对话、智能教育等多种场景化AI服务。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1