4月11日,在2023阿里云峰会上,阿里正式宣布推出大语言模型“通义千问”,并开始邀请用户测试体验。据悉,“通义千问”是一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等。阿里董事会主席兼首席执行官张勇表示,未来阿里所有产品都将接入“通义千问”实现全面升级。
“通义千问”是阿里云智能首席技术官周靖人领衔的团队自主研发的大模型,其训练数据截止至2023年2月,可以联网查询信息,例如直接提供网页摘要和翻译等。周靖人介绍,“通义千问”可通过API插件实现AI能力的泛化,不仅可以通过实现续写小说,编写邮件和生成会议摘要等功能帮助用户提升工作效率,还可以通过调用差旅接口推荐差旅产品,作为智能购物助手自动推荐品牌和产品提升用户购物体验。
在云峰会上,张勇介绍了钉钉、天猫精灵等阿里旗下产品在接入“通义千问”后变得更加智能和强大。天猫精灵接入“通义千问”后,不仅能够支持自由对话,可以随时打断、切换话题,还可以根据用户需求和场景随时生成内容,成为更聪明更人性化的智能助手;钉钉接入“通义千问”后,不仅能够自动生成工作方案,还可以在会议纪要后自动生成总结和待办事项,总共可以实现近10项新AI功能。
张勇说,“通义千问”是一场“AI+云计算”的全方位竞争,超万亿参数的大模型研发,并不仅仅是算法问题,而是囊括了底层庞大算力、网络、大数据、机器学习等诸多领域的复杂系统性工程,需要有超大规模AI基础设施的支撑。他表示,阿里云已经累积了从飞天云操作系统、自研芯片到智算平台的“AI+云计算”的全栈技术实力,这些技术将为未来AI时代企业和社会的发展提供强大助力,并且阿里云将会把这些AI基础设施和大模型能力向所有企业开放,共同推动AI产业的发展。
发布会当天,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模模型基础设施,基于“通义千问”完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。同时,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。阿里云在大模型应用方面的生态建设已初见成效。
“通义千问”是阿里云智能在人工智能领域的重要突破,也是国内大模型领域的一次重要尝试。据悉,“通义千问”目前还在不断学习和成长中,未来将不断提升其功能和性能,为更多用户提供更好的AI服务。阿里云智能邀请所有有兴趣的用户参与“通义千问”的测试体验,共同见证AI的发展和进步。
2022年11月,OpenAI也推出了自己的大语言模型ChatGPT,该模型可以与用户进行自然的文本对话,并生成有创意的写作作品。ChatGPT是基于GPT-3.5语言模型构建的,该模型于2022年初完成训练。
那么,“通义千问”和ChatGPT到底有什么不同呢?
我们从以下几个方面进行比较:
参数规模是衡量语言模型复杂度和能力的一个重要指标。
“通义千问”的参数规模为1.2万亿,而ChatGPT的参数规模为1.5万亿。
两者都是目前全球最大的语言模型之一,但ChatGPT略微领先于“通义千问”。
训练数据是影响语言模型质量和泛化能力的一个关键因素。
“通义千问”的训练数据截止至2023年2月,可以联网查询信息,例如直接提供网页摘要和翻译等 。
ChatGPT的训练数据则是基于互联网上海量的文本数据进行训练的。
两者都拥有丰富和多样化的训练数据,但“通义千问”具有更强的实时性和时效性。
模型架构是决定语言模型性能和效率的一个重要因素。
“通义千问”和ChatGPT都是基于Transformer架构构建的,该架构可以使模型学习语言中的规律,并生成连贯和人性化的文本。Transformer架构还可以支持多模态输入和输出,例如图像和音频。
“通义千问”和ChatGPT在Transformer架构上都进行了一些优化和改进,以提高其计算速度和资源利用率。
优化方法是影响语言模型学习效果和对话质量的一个重要因素。
“通义千问”是基于人类反馈进行强化学习优化的,这使得它可以根据用户的偏好和满意度调整自己的回答,并提高对话质量。
ChatGPT则是基于监督学习进行微调的,这使得它可以更好地适应特定的任务或领域。两者都采用了先进的优化方法,但“通义千问”具有更强的交互性和适应性。
从以上比较可以看出,“通义千问”和ChatGPT都是目前全球领先的大语言模型,它们在功能和性能上各有优势和不足。
一般来说,“通义千问”在文本对话、阅读理解等方面表现较好,而ChatGPT在推理、数学等方面表现较好。两者都有时会生成不正确或无意义的回答,这是目前大语言模型面临的一个共同挑战。未来,我们期待两者能够不断改进和创新,为人类带来更多惊喜和价值。