OpenAI 发布全新 GPT-4 Turbo with Vision，网友实测：编码不如旧版本！

作者：书圈发布时间：2024-04-14

| CSDN（ID：CSDNnews）

今天，OpenAI 宣布GPT-4 Turbowith Vision 版（具有视觉功能的最新 GPT-4 Turbo 模型）已经通过 OpenAI API 正式上线。

GPT-4 Turbo 是一种强大的多模态模型，能够处理文本和图像输入，并凭借其广泛的常识和先进的推理能力提供准确的输出。

OpenAI 在去年 11 月的DevDay 期间推出了 GPT-4 Turbo，展示了其增强的功能和截至 2023 年 4 月的扩展知识库。凭借 128k 上下文窗口，该模型可以在单个 Prompt 中处理超过 300 页的文本。

时下这个最新的模型保持了原有 GPT-4 Turbo 的 128k 上下文窗口，模型训练的数据截止日期更新为 2023 年 12 月。而主要更新在于它的视觉功能，可以理解图像和视觉内容。

升级后的 GPT-4 Turbo 模型有望提高性能，并且不久之后也将在ChatGPT中推出。

此前，GPT-4 Turbo 的显著亮点之一是其优化的性能，从而大幅降低用户的成本。与之前的 GPT-4 模型相比，输入 token 的价格现在降低了三倍，而输出 token 的成本则降低了一半，这使得此次升级对不少用户来说既高效又经济，而且还为各种用例打开了新大门。

在 X 平台上，OpenAI 也随之分享了一些开发人员使用该模型的具体方法，例如，AI 软件工程助手 Devin利用 GPT-4 Turbo with Vision 来更好地协助编码。

健康和健身应用 Healthify 使用 GPT-4 Turbo with Vision 扫描用户的膳食照片，并通过照片识别提供对营养的见解。

Make Real 使用 GPT-4 Turbo with Vision 将用户的草图转换成可运行的网站。

一张草图生成一个网站似乎已经逐渐成为了现实。

不过就在 GPT-4 Turbo with Vision正式发布之际，也有一位网友 Paul-Gauthier 对编码功能展开了评测。

有些出乎意料的是，Paul-Gauthier称，「GPT-4 Turbo with Vision 版本在 aider 的编码基准套件中的表现比之前所有的 GPT-4 模型都要差。尤其是，与现有的 GPT-4 Turbo "预览"模型相比，它似乎更容易在编码方面“偷懒”。

代码编辑能力

Aider 依靠代码编辑基准来定量评估 LLM 对现有代码进行修改的能力。该基准使用 aider 尝试完成 133 个 Exercism Python 编码练习（https://github.com/exercism/python）。

对于每个练习，LLM 会尝试两次来解决每个问题：

在第一次尝试中，它将获得初始存根代码和编码任务的英文描述。如果测试全部通过，我们就完成了。
如果有测试失败，aider 会向 LLM 发送失败的测试输出，并让它进行第二次尝试以完成任务。

GPT-4 Turbo with Vision在这项基准测试中的得分仅为 62%，是现有 GPT-4 模型中得分最低的。其他模型的得分在 63-66% 之间时，这个最新的模型只是稍有退步，与 gpt-4-0613 相比差距并不明显。

编码的惰性测试

还记得彼时 GPT-4 Turbo preview 模型因在编码时“偷懒”，受到了不少业界开发者的批评。它们经常省略所需的代码，而在注释中留下“在此处实现方法”之类的语句，如

def some_complex_method(foo, bar)：# ... 在此处实现方法 ...

Aider 使用一个“懒惰”基准套件，旨在激发和量化懒惰编码。它由 89 个 Python 重构任务组成，这些任务往往会让 GPT-4 Turbo 以懒惰的方式编码。

新的 GPT-4 Turbo with Vision 模型在 aider 的重构基准测试中只获得了 34% 的分数，是所有 GPT-4 Turbo 模型中最懒惰的编码工具。

完整的评测可以详见：https://aider.chat/2024/04/09/gpt-4-turbo.html

最后，你是否体验上了 GPT-4 Turbo with Vision 版本，有什么样的感受？

来源：

https://www.zdnet.com/article/openai-makes-gpt-4-turbo-with-vision-available-for-developers/

https://twitter.com/OpenAIDevs/status/1777769468996845718

https://aider.chat/2024/04/09/gpt-4-turbo.html

对于想要选购家用MPV的消费者来说，大家在买车前一定会先看看每个月的销量榜单，比如在11月的销量排行榜中，位列前茅的就有赛那和格瑞维亚这两款兼顾大空间和燃油经济性的混动MPV。不过对于很多普通消费者来说，高达二三十万的价格就已经劝退了不少人，再加上在城市使用也不需要这么大的车身尺寸，那么在20万以内有能够平替这两款混动MPV的买车选项吗？当然有，它就是在销量上紧追赛那和格瑞维亚的另一款混动MPV——传祺E8荣耀系列。首先从大家最关注的价格上来看，相较于赛那等MPV车型高达二三十万的售价，传祺E8荣耀系列的

大侠上车 2024-12-28

清查规定修订情况说明

一、第二条第3款调查内容中的生态状况删除了土地沙化、荒漠化和湿地类型，增加了林地自然环境状况的调查内容。二、第八条第1款林地划分为8个二级地类（乔木林地、灌木林地、竹林地、疏林地、未成林造林地、苗圃地、迹地和宜林地）、13个三级地类。第2款各类林地地类划分技术标准作了相应调整。1、去除“有林地”二级地类，“乔木林地”和“竹林地”为二级地类。把原乔木林中“因人工栽培而矮化的”归类到灌木林地。把原红树林按乔灌属性分别归类到乔木林地和灌木林地。2、把原国家特别规定的灌木林地更名为“特殊灌木林地”，其它灌木林

林草曹迎春 2024-12-27

中国海洋大学日语笔译总分第2名经验分享—才能は開花させるもの丨24年经验丨瑞译“

——胡萝卜碎语最近去新疆旅游了几天（8月20日-28日），基本上每天都是早上出门，夜里到酒店，超级累，所以大部分时候都是抬头就睡。新疆是东六区，虽然也用北京时间，和东八区有2-3个小时的时差。夏天晚上22点左右才会完全黑下来。我每天都日行几百公里，坐得屁股生疼，而且这还是限制后的——为避免赶路时间过长，新疆旅游规定，旅游车每天行车不能超过600KM。新疆的山河确实壮丽，走在路上我脑海中浮现的最多的，是左宗棠。左宗棠在古稀之年抬棺入僵，最后收复了大部分的国土。我简直无法想象，在没有现代交通工具和现代

瑞译学苑-MTI及CATTI日语 2024-12-28

奋能达电子（深圳）有限公司，作为TDK公司的官方授权一级代理商，长期以来以其卓越的产品质量、专业的技术服务和良好的市场口碑，赢得了广大客户的信赖与支持。我们深知，在快速发展的电子行业中，唯有不断创新、精益求精，方能立于不败之地。因此，我们始终专注于为客户提供原装的TDK产品及全方位的解决方案，致力于成为客户最信赖的合作伙伴。一、信誉为本，品质为先奋能达电子与TDK公司保持着长期紧密的合作关系，这种紧密的合作不仅为我们带来了丰富的产品资源，更确保了每一件产品的原厂原装与卓越品质。我们的信誉和口碑在行业内

奋能达电子 2024-12-28

OpenAI 发布全新 GPT-4 Turbo with Vision，网友实测：编码不如旧版本！

推荐体验

相关资讯