上手ChatGPT威力加强版后，我发现它很强，但也有点拉。。。

作者：差评发布时间：2023-03-16

ChatGPT GPT-4

今天凌晨，OpenAI 发布了最新的 GPT-4。

根据发布会披露的内容来看，这个新一代比早先大家使用的 ChatGPT 的 GPT-3.5 内核 强悍了一大截，再次刷新了编辑部对 AI 的认知。

首先，非常非常重要的一点是， GPT-4 可以接受文字以外的内容输入了，目前支持文字与图像的混合输入。

在官方的示例中，用户给 GPT-4 上传了一张梗图，问 GPT-4 这张图为什么好笑：

GPT-4 非常详细且精准地描述出了图片上的内容。

并且有思维条理的解释了，为什么这张图会让人觉得好笑。

这还不算完，就算是十分抽象的 Meme，它也能一本正经地给你解释笑点在哪里。

只不过么，GPT4 也还没到能通过图灵的程度。

当然，这个功能并不只是能解释梗图那么简单，它拥有无限的想象空间，比如：

在今天凌晨的官方直播视频中，GTP 的开发人员演示了 GPT-4 可以识别他手绘的一张网页草图，并且根据草图写出网页的前端代码。

手绘的网页草图，非常抽象▼

GPT-4 给出的网页以及代码 ▼

虽然这个示例里的网站非常简单，但 GPT-4 的理解能力和创造力还是让人觉得不可思议：

重要的不是它能不能做得很好，而是它能做到，这是一个质的飞跃。

甚至，目前已经有公司在搞这项技术的落地应用，打算把它和导盲服务结合起来。

这样一来，盲人只需要拍张照，GPT-4 就能立即复述出面前物品的信息。

而在文字问答方面，GPT-4 也有非常大的提升，输入字增加到了 2.5 万。

在专业领域上的回答， 特别是 “ 问题复杂度足够高的时候……GPT-4 比老版本更细、更可信、更富有创造力 ”。

比如，在统一律师考试（ Uniform Bar Exam ）中，GPT-4 可以超过 90% 的人类考生，而老版本只能超过 10% 的人类考生，妥妥学渣学霸的区别。

在 GRE 数学和语文（阅读与填空）考试中，GPT-4 的考试成绩 已经是哈佛、麻省理工、斯坦福大学生的水平了。

不仅自己回答问题能力变强了，GPT-4 还会人格扮演。

比如你提出一个问题，ChatGPT 只会机械式地回答，而 GPT-4 可以按你的要求 以苏格拉底风格给你作答。

那这个玩法就多了呀。

向下滑动▼

不过，说了这么多，百闻不如一试。

即使已经是凌晨 2 点，编辑部依旧花重金（ 20 美元/月），连夜让美国同事帮忙升级试用了一波。

遗憾的是，OpenAI 考虑到用户们搞幺蛾子的能力太狠，所以目前 GPT-4 的 图片输入功能暂时不对公众开放，也没有说啥时候可以用上。

不过，我们还是可以试试它聪明的小脑瓜子。

先是给了一个全网疯传的“ 华为、阿里入职面试题 ”，挑战大获成功。

而隔壁的 ChatGPT 就有点拉了。

作为击败了 90% 人类的大律师，GPT-4 的推理能力应该强无敌吧。

所以我们又搞了道法考的经典案件，想掂量掂量 GPT-4 到底有几斤几两。

问：乙去甲家吃饭，结果电动车被偷了。于是乙准备偷辆别人的电动车，此时，喝醉的甲来帮忙撬锁，帮乙成功得手。结果调查后发现，乙偷的是甲的电动车，问甲算不算是盗窃罪？

虽然新旧两款结论都是正确的，但是旧版的解题过程，就有点乱来了。。

而在一些 更需要 “ 创造性 ” 或是 “ 思考 ” 的问题，比如：

关于最近一次特斯拉投资者大会上 “ 实现全球可持续能源 ” 的计划，你觉得是可行的吗？为什么可行？

GPT-4 的表现就更让人吃惊了。

虽然 GPT-4 的知识库停留在 2021 年 9月，并没有覆盖半个月前的那场投资者大会， 但它却神奇地未卜先知了。

而老版本 ChatGPT 的回答就逊色了很多，没有条理，还有一堆车轱辘话，没有建设性观点。

随后，我们又问了一个行业思考相关的问题：

你如何看待全球的碳排放战略，它能成功吗？

老版只能浮于表面笼统地给点泛泛的概念，而 GPT-4 的回答明显 维度更宽、思考更深，洋洋洒洒列了 10 点，更加细致有条理，并且含有更多专业词汇与内容，可以说几乎完美地回答了这个问题。

上面这些，还仅仅只是我们编辑部的试验，在一些大佬们手上，GPT-4 令人恐惧的表现就更多了。

比如仅仅只用了 60 秒，就做出了一款 Pong 游戏，20 秒就能做出贪吃蛇游戏。

不可否认，GPT-4 比起旧版来说，强的不是一点半点。不过我们试出来的问题，其实也不少。

我们搞了套 高中数学竞赛试卷来考它，结果，一试就尴尬了。。 第一道选择题，新旧两个版本就都解错了。

难道说，斯坦福、麻省理工还不如。。？

因为 GPT-4 可以支持更长的输入文本，所以我们就又测试了它的总结概括能力。

这下馅露得更大了。

我们甩给它的是，差评君之前发过的一篇文章的链接，其实 GPT-4 是没有联网的，正常来说是没法总结的。

结果，它愣是 凭空捏造了两个文章总结，而且和我们给的文章没有任何关系。

直到在我反复指正两次，语气都加重了，它才承认自己的错误。

直到后面我们把原文直接贴进去后，GPT-4 才展露了它超强的总结能力。

说实话，这个胡编乱造的能力让我们心里一惊，于是就又想了个测试方法。

前两天，小黑胖把“ 手拿把攥 ”记混成“ 手拿把蒜 ”，被编辑部嘲笑了很久，于是我们就问 GPT-4 “ 手拿把蒜什么意思？”

结果牛掰了，GPT-4 在理解了一部分“ 把蒜（攥）”是形容事情轻而易举的基础上，引经据典地胡编乱造，颇有种当年我写作文时，引用的俄罗斯文学家“ 沃兹基索德 ”的味道了。

要知道，如果是真实场，这个半真半假、引用权威的胡说八道的后果将是非常严重的，堪称最高级的谎言。

明明连更老的 ChatGPT 也不敢这么捏造来源地胡说，更高级的 GPT-4 怎么会这样呢？

我们猜测，就是因为 新版本更倾向于表现出 “ 更具有深度思考 ”，这么一来，在回答很多问题的时候，GPT-4 会自己给自己加戏，才会出现这些闹剧。

虽然我们试了这么多漏洞，但总的来讲，这次发布的 ChatGPT，无论是基础功能、想象空间、逻辑能力、思考能力，都比之前强了一大截。

明明距离老版本 ChatGPT 颠覆我们的认知才没几个月，它们就又掏出了一个船新版本，我们只能说：

恐怖如斯。

更恐怖的是，其实 GPT-4 诞生时间，可能比我们想的还要早很多，之前 OpenAI 发布基于 GPT-3.5 的 ChatGPT 时，内部员工就质疑过为啥发个这么古早的版本。

而我们也早就接触过 GPT-4 了，New Bing 官方今天发了个公告，承认了 New Bing 其实就是 GPT-4。

所以这么说的话，有没有种可能，GPT-5 也已经近了呢？

我已经开始期待除了文字、图片以外，视频、音频等形式的输入了。

撰文： 大饼 & 小陈 & 四大 & 八戒编辑：面线 & 江江封面：萱萱

图片、资料来源：

OpenAI、New Bing 官网、Twitter、Be My Eyes

New York Times：How ChatGPT Kicked Off an A.I. Arms Race

如果您觉得本文写的还不错

欢迎关注差评孵化的商业财经类账号：知危（ ID:BusinessAlert ）

近期资讯

A-N_O 2024-12-26

必入！质感爆棚✔️千里马全铝硬盘盒来袭

【高效办公必备】千里马全铝硬盘盒来袭！宝子们，今天必须给你们安利这款千里马全铝合金硬盘盒?。先看外观，采用阳极氧化工艺，拿到手瞬间被惊艳，金属光泽超亮眼，摸起来冰冰凉凉，质感直接拉满，这颜值放在桌面那就是个科技潮品。性能更是杠杠的！传输速率高达 10Gbps，还搭载 9210高阶主控芯片，NVME 协议，不管是传输大型 3A 游戏，还是零碎的办公文档，那速度，就跟火箭升空似的，眨眼间就完成，告别传输焦虑。散热方面更是一绝，独特的鳍型条纹设计，高效带走硬盘热量，让硬盘时刻保持“冷静”，使用寿命大大延

Auiu数码 2024-12-26

出入口管理系统包括车牌识别停车场系统、二维码刷卡人脸识别闸机、访客机、门禁梯控

本文主要介绍了门禁及可视对讲联动电梯门禁系统，包括通道闸机门禁系统、访客系统、可视对讲系统的围墙机和电梯门禁系统。出入口管理系统包括车牌识别停车场管理系统、二维码刷卡人脸识别闸机、访客机、单元门禁和电梯门禁。门禁及可视对讲联动梯控系统（以下简称电梯门禁系统）楼宇可视对讲联动电梯门禁系统说明： ①在全数字化楼宇可视对讲系统的基础上，增设电梯门禁系统，门禁及梯控系统与楼宇可视对讲系统联网同步在线运行同时还需联动功能。详细说明如下：通道闸机门禁系统+访客系统+可视对讲系统的围墙机形成第一道安防（以下简称出

多奥科技 2024-12-26

vivo S20 Pro人像拍摄怎么样？摄影再升级——影像旗舰的全新突破

众所周知，vivo坚持在手机影像赛道上进行不断探索，最近带来了经过全新升级的vivo S20 Pro，专业影像是它的一大亮点，影像部分，人像拍摄是它最大的优势，也是vivo专门打造的“拍人最好手机”！vivo S20 Pro通过出色的前后柔光四主摄、丰富的影像模式以及贴心的拍照优化功能，完美满足了当代用户对影像记录的多样化需求。从自拍到夜景人像，从静态大片到动态创意，它都能轻松胜任。后置镜头上，Pro的配置要更高，搭载 5000 万索尼超防抖仿生主摄，支持自研 OIS 超级防抖；长焦是5000 万索尼超级

银桑老师谈科技 2024-12-26

数字营销徐嘉祥：星辰幻界从默默无闻到爆款之路

在游戏行业这个竞争激烈的领域，有一家初创公司，名为“幻光游戏工作室”，他们怀揣着打造一款具有独特魅力的角色扮演游戏的梦想，但在市场上却面临着巨头林立、资源有限的困境，其首款游戏《星辰幻界》的推广之路充满了挑战与机遇，而他们的市场营销故事，也成为了行业内的一段佳话。起初，幻光游戏工作室的团队成员们深知，他们没有雄厚的资金去进行大规模的广告投放和明星代言，于是决定另辟蹊径。他们首先将目光投向了游戏社区和论坛，这是游戏爱好者们聚集交流的地方，有着精准的目标受众。团队成员们纷纷注册账号，以普通玩家的身份深入各个

徐嘉祥 2024-12-26

仓库管理别只是做样子给客户看?

走进一些公司仓库，环境整洁得几乎像展示厅，货架上物品井然有序，工人忙碌地穿梭，但总感觉这里面没有多少“活儿”？当你要求查看具体库存数据，系统反应迟缓，甚至有些信息完全不对，看起来“高大上”的仓库，背后是堆满问题的“空壳”！事实上，仓库管理对企业来说，真的不只是个展示给客户看的“样子货”。别让你的仓库只是个“摆设”，做点实事！今天，我们就来聊聊，为什么仓库管理不应当只是“做样子”，而要有实际的操作和效果。文中的用到的案例系统已经整理成模板，感兴趣可以自取：https://s.fanruan.com/hzb5

保卫大狮兄 2024-12-26

精密空调—如何充注精密空调制冷剂？

在进行精密空调制冷剂的充注操作时，为确保操作的安全性和有效性，需特别注意以下事项。一、安全防护 1、操作人员需佩戴好个人防护装备，包括安全眼镜、防护手套、防护服等，防止精密空调制冷剂溅到皮肤或眼睛造成伤害。 2、确保操作现场通风良好，避免精密空调制冷剂泄漏导致室内浓度过高，引发中毒或窒息风险。 [图片] [图片] [图片] 二、专业操作 1、精密空调制冷剂的充注应由具备相关资质的专业人员进行，确保操作的规范性和准确性。 2、在充注前，需对精密空调进行全面的检查，确认无泄漏点及异常现象，确保充注过程的安全

汇智天源 2024-12-26

上手ChatGPT威力加强版后，我发现它很强，但也有点拉。。。

推荐体验

相关资讯

ChatGPT-4威力加强版上手：它很强但也有点拉

上手试了快手的视频AI，我发现它竟然有点领先。。。

ChatGPT是加强版的搜索引擎吗?

GLM 大加强，清华团队推出 GLM 联网加强版 WebGLM！

体验了ChatGPT App半小时后，我发现它“中看不中用

近期资讯

vivo S20 Pro蓝晶天玑性能出众，比肩旗舰的全面非凡体验

AI眼镜_AI智能眼镜定制开发_基于紫光展锐W517方案开发

天赋和努力哪个重要

圣诞树看起来就像...

必入！质感爆棚✔️千里马全铝硬盘盒来袭

出入口管理系统包括车牌识别停车场系统、二维码刷卡人脸识别闸机、访客机、门禁梯控

vivo S20 Pro人像拍摄怎么样？摄影再升级——影像旗舰的全新突破

数字营销徐嘉祥：星辰幻界从默默无闻到爆款之路

仓库管理别只是做样子给客户看?

精密空调—如何充注精密空调制冷剂？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响