当前位置：首页|资讯|文心一言|GPT-4|ChatGPT

|计算机深度研究：文心一言、GPT3.5及GPT-4应用测评对比

作者：国金证券研究发布时间：2023-03-27

文心一言 GPT-4 ChatGPT

金选·核心观点

投资逻辑

OpenAI于2023年3月14日发布最新版本多模态大模型GPT-4及其API；国内百度于3月16日发布生成式大模型“文心一言”并开放邀请测试。为对比国内外大模型在各领域的性能差异，我们对文心一言、GPT-3.5（ChatGPT的原模型）和GPT-4的问答表现分别进行了测评。测评涉及常识和创作（文学/图片）、归纳和推理（演绎推理/情感推理/逻辑推理/主体信息抽取）、数学和代码、应用（AI助手/客服/办公协同/推荐/诗词理解）等方面。

在常识和创作类问题中，三大模型均能正确回答客观常识类问题；进行文学创作结果均能体现正面价值观，但文心一言的分词功能有待提升；目前GPT-4尚未开放图像生成外部测试，文心一言的图像生成能力较为出色。

在归纳和推理类问题中，文心一言在演绎推理、逻辑推理等领域表现略逊于GPT系列模型，但在归纳总结类任务中表现较好；三大模型在情感推理类问题中仍有提升空间。

在数学和代码类问题中，GPT-3.5有更好的数学能力表现；GPT-3.5及GPT-4模型均完成了本文提出的代码生成问题，但并非最优解，文心一言代码问题识别能力有待加强。

在应用场景测试中，三大模型均能较好地完成AI生活助手、售后客服、产品推荐、办公场景文本生成等任务，但在文言文和古诗词理解运用方面表现不佳。我们认为随百度文心及OpenAI合作生态伙伴数量快速增长、训练数据量和模型训练能力持续提升，各模型性能都有望实现进一步优化完善。

投资建议

文心一言、GPT-3.5、GPT-4三大模型在常识问答、文字生成等领域均有出色表现，其中，文心一言虽然在逻辑推理等任务中表现不及GPT-3.5、GPT-4，但已能够基本满足AI助手、售后客服、产品推荐等诸多场景需求。百度文心的开放应用将极大加速国内生成式AI模型的落地应用节奏，有望帮助生态伙伴实现用户体验提升和生产降本增效。我们建议关注在AI领域进行持续布局且拥有成熟应用场景的公司，如万兴科技、汉得信息、凌志软件、同花顺、金山办公。

风险提示海外基础软硬件使用受限；应用落地不及预期；行业竞争加剧风险；测评问题有限导致结果或有偏差。

推荐体验

相关资讯

计算机行业研究_文心一言_GPT3.5及GPT-4的应用测评对比(附下载)

今天给大家带来【深度报告-20230319-国金证券-计算机行业研究_文心一言_GPT3.5及GPT-4的应用测评对比】报告内容节选如下：来源：国金证券关注公众号【全球行业报告圈】获取完整PDF电子版免责声明…

文心一言 GPT-4

躺倒猫 2023-03-23

【国金晨讯】文心一言、GPT3.5及GPT-4的应用测评对比；

【计算机孟灿】文心一言、GPT3.5及GPT4对比：建议关注万兴科技、汉得信息、凌志软件、同花顺、金山办公。三大模型在常识问答、文字生成等领域均有出色表现，其中，文心一言虽然在逻辑推理等任务中表现不及GPT-3.5、GPT-4，但已能够基本满足AI助手、售后客服、产品推荐等诸多场景需求。

文心一言 GPT-4 客服

国金证券研究 2023-03-20

计算机行业深度研究：“文心一言”发布，国内应用预计加速

百度于2023年3月16日召开关于“文心一言”的主题发布会，“文心一言”作为国内首款正式发布的生成式语言大模型，拥有文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成等功能。AI大模型与行业大模型：文心平台提供NLP、CV、跨模态、生物计算四大主流AI研究领域的多个基础大模型，多个模型在技术层面实现突破创新，处于世界领先水平。

文心一言百度 AI大模型

国金证券研究 2023-03-17

工联院大模型测评：文心一言在工业领域表现超过GPT3.5

北京商报讯（记者魏蔚）6月28日，北京商报记者获悉，中国工业互联网研究院（以下简称“工联院”）针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测结果显示，百度文心一言表现超过GPT3.5，综合评价指数在国内排名第一。主观题方面，国内大模型的基础能力、语句能力与GPT4接近，概括能力、逻辑能力与GPT4有一定差距。

文心一言 GPT-4 人工智能百度

北京商报 2023-06-28

文心一言，甩开GPT-3.5，与GPT-4掰手腕？

“我女朋友的老公应该叫我什么？”作为国产版ChatGPT，文心一言在发布后，除了赞誉的声音，以各种形式被批判应该在意料之中，ChatGPT当初也是如此，这是产品不断进化要经历的过程。

文心一言 GPT-4 ChatGPT

智能相对论 2023-03-27

近期资讯

云计算架构学习整理（八）：认证与安全

本章着重讲解与认证相关的机制以及安全的基础知识。 HTTPS协议可用于数据加密，提供数据完整性和身份认证机制；使使用令牌、单点登录等身份认证机制

Paramita 2024-12-28

RecycleView 局部刷新抽风闪烁

RecycleView 局部刷新抽风闪烁最近使用RecycleView进行列表渲染的时候出现了一些状况如图，在之前我几乎都是让recycleView全部刷新，但是这个黄线非常让人不爽

用户1075561752407 2024-12-28

玩转 Vue 哲学：从 2 到 3，快乐的进化！

本文探讨了 Vue 的发展历程，重点介绍了 Vue 2 和 Vue 3 的哲学差异。通过对比两者的特性与编码风格，分析了 Vue 如何通过双向绑定、计算属性和组合式 API 提升开发体验。

answerball 2024-12-28

文件批量重命名工具

文件批量重命名工具：优化资源文件处理流程背景在开发移动应用时，UI设计通常会提供不同分辨率的图片资源来适配多种屏幕尺寸。例如，在一个特定的应用场景中，seekbar范围0-64对应64张图片，用于

望佑 2024-12-28

vue常用的生命周期函数的用法与特点

今天我们继续来进阶vue，来聊一聊vue中一些常用的生命周期函数的用法与特点。 1. 什么是生命周期首先，我们来搞清楚一下什么是生命周期。就我们人类来说，生命周期指的就是我们从出生到离世的整个过程。

午后书香 2024-12-28

《探秘前端：页面精修、函数巧用与性能护航》

一、页面雕琢：构建搜索引擎友好的前端基石 1.HTML5 的语义化标签：开启精准语义表达，赋能 SEO 新篇 HTML5 相较于之前的 HTML 版本引入了新的语义化元素，如、

初出茅庐的小藤神 2024-12-28

Nuxt的接口设计和接口开发（一）

Nuxt 的接口设计与接口开发在 Nuxt 项目中，接口如同桥梁，横跨前端与后端，连接用户交互与数据处理逻辑，其设计与开发的优劣，直接关乎整个应用的性能、可维护性以及用户体验。接口设计原则 RES

麻爪 2024-12-28

说出示例代码执行结果（Promise）

Promise 创建后立即执行，resolve 或 reject 函数在同步代码之后执行，等到 resolve 或 reject 执行后，进入 then 或 catch 函数。

南星媛 2024-12-28

React设计模式：构建可扩展应用的最佳实践

掌握React设计模式，打造高效、可扩展的应用。本文深入探讨容器与展示组件、自定义Hooks、记忆化等核心模式，助你写出更干净、模块化的代码，提升开发效率。立即阅读，让你的React技能更上一层楼！

倔强青铜三 2024-12-28

微信流量主挑战：用户数30！新增文档转化功能，解决docker运行jar包报错SimSun找不到的问题（新纪元5）

哎呀，今天忙到飞起，文章晚点更新啦！不过好消息是，我们的小程序用户终于突破30啦，感谢大家的支持！而且，大家期待已久的文档转化功能明天就要上线啦，目前支持word转pdf，pdf转图片，xlsx转pd

对方正在输入963 2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1