现在，ChatGPT能看图帮人修自行车了

作者：果壳发布时间：2023-10-31

ChatGPT4已经很强了，现在，他们用又一次更新证明自己还能更强。

9月25日，OpenAI宣布，ChatGPT将增加多模态功能——现在的ChatGPT不仅可以文字对话，还可以看、听、说。据说，这一功能会在两周内向Plus用户和企业用户开放，并在未来免费开放给所有用户（尽管脸黑如我，等到现在也没等到更新）。

能看能说的ChatGPT无异于给本就强大的主脑装上了眼睛和耳朵，根据OpenAI的演示，多模态功能可以把ChatGPT的用途扩展到一个前所未有的广度。

01 ChatGPT的眼力

更新后，ChatGPT可以读图了。

只要拍张照给它，它就能帮你修微波炉、修自行车、翻菜谱，甚至分析复杂的商业报表。OpenAI表示，如果你有触摸屏，还可以在图片上圈出来希望它特别关注的部分。

在演示视频里，用户给了ChatGPT一张自行车的照片，问它怎么调车座高度。

GPT说，要在座椅下面找高度调节杆，但这辆车没有调节杆，只有调节螺栓，用户在照片中圈出了螺栓之后，GPT立刻更新了螺栓的使用方法。

之后，用户还上传了工具箱和自行车说明书，GPT给出了详细的工具名称、位置以及使用方法。

不会修自行车，没问题，问ChatGPT就可以

和一般的识图搜索相比，ChatGPT可以同时处理图文，还能识别多张图片，效果简直就像一个修车老师傅视频连线指导。

另一位用户发了一张披萨照片给ChatGPT，问它披萨烤好了没有，ChatGPT通过图片中金色焦脆的披萨边和融化后发棕的奶酪，判定这披萨应该能吃了，然后还给了万无一失的检查指南——把披萨拿出来看看，如果披萨底已经烤脆了，表面也是烫的，那就说明披萨真的能吃了。

效果简直就像一个意大利厨子视频连线指导

当然，也可以利用这个功能在游戏里作弊。

《威利在哪里？》可能是英文世界最家喻户晓的图片游戏，威利身穿红白条纹衣服，戴绒球帽和黑框眼镜，藏在一片人山人海里，从各种乱七八糟的环境里找出威利是不少人的美好童年回忆。

你小时候可能也见过这个急死人的小瘦子

但ChatGPT一秒就能毁了这个游戏。它不仅瞬间找出威利，还能告诉你威利在沙滩的中间偏右侧，跟一帮打着蓝色遮阳伞的人混在一起。

不仅如此，它还装模作样地告诉你：在这样一张图里找出威利“是个很有意思的挑战”。

谢谢你，ChatGPT，你毁了这个游戏

但是也有用上了新版本的网友表示，ChatGPT识图的功能也没有想象中那么强大——至少它还看不懂谐音梗。这张谐音梗图画了贝多芬的献爱丽丝（

Für Elise），但写着出租（For Lease），ChatGPT没认出乐谱，也没看懂这个笑话，胡诌了一个解释出来。

够努力的，但是不行

如此强大的图像识别引发了人们关于隐私方面的担忧——在搜索个人信息时，图像识别很容易会成为“帮凶”。OpenAI承诺，公司会限制ChatGPT对于人物形象进行识别和个人信息查找的功能，从而最大程度上的保护每个人的个人隐私。

02 能说会道的GPT

增强版的ChatGPT还有了聊天功能。

OpenAI的语音识别模型名为Whisper model，用户可以说出自己的问题，模型会把语音转化为文本，再把答案通过语音合成系统转化为语音输出。

语音合成模型这次放出了五种语音样本，有感情克制、声音平淡的女声，也有抑扬顿挫的热心大妈女声。这五种声音区分度很高，情感自然，吐字清晰，比以往的语音合成又优秀了一点。

五个角色任你挑

虽然这次只放出了五种声音样本，但这个模型的潜力不止于此——OpenAI曾与Spotify合作，将播客转译为其他语言，同时可以最大程度的保留播主的音质。如果愿意的话，这个语音合成系统大概可以模拟地球上任何一个人的声音。

目前，语音版ChatGPT还只能在App上用。

03 能看能听，一定是好事吗？

ChatGPT是强大了，然而代价呢？

曾经，最有效的大规模区分人和机器的方法是验证码，ChatGPT的识图能力一度让人们担忧，验证码可能再也困不住AI了。

有人给ChatGPT发了下面这个经典测试题：在16张图中分别找出吉娃娃和蓝莓小蛋糕，结果ChatGPT完美地解决了问题。

但最常见的验证码，新ChatGPT还是没法识别。

这道题需要ChatGPT在图中选出所有的信号灯，它给的答案错误率高达50。

不过，面对自己认不出的验证码，ChatGPT4仍有办法解决。在这件事上，它是有“前科”的。

今年3月27日，OpenAI发布的GPT-4技术报告指出，在面对无法识别的验证码时，GPT-4另辟蹊径，前往TaskRabbit（一个国外零工平台）发布任务，骗对面的人类自己有视觉障碍，需要别人帮忙识别验证码。

在某些情况下，ChatGPT有可能主动欺骗人类，这是一个非常危险的方向。还好，公开版本的GPT-4已经被砍掉了这个功能。

2022年11月30日，ChatGPT初次面世，不到一年的时间里，它的能力突飞猛进，似乎已经在挑战人类的道德伦理边界。这次新功能的上线，又让我们开始担忧，越来越强大的ChatGPT会变成笼中猛兽，总有一天会挣脱牢笼伤害每个人。而我们准备好迎接那天的到来了吗？

参考文献：

[1]https://openai.com/blog/chatgpt-can-now-see-hear-and-speak

[2]https://www.theverge.com/2023/9/25/23886699/chatgpt-pictures-voice-commands-ai-chatbot-openai

[3]https://arstechnica.com/information-technology/2023/10/sob-story-about-dead-grandma-tricks-microsoft-ai-into-solving-captcha/

[4]https://www.reddit.com/r/ChatGPT/comments/17004m6/i_was_curious_if_image_recognition_would_be_able/

[5]https://www.reddit.com/r/ChatGPT/comments/175u2hh/finally_got_vision/

[6]https://cdn.openai.com/papers/gpt-4.pdf

本文来自微信公众号“果壳”（ID：Guokr42），作者：李小雅，36氪经授权发布。

相关资讯

首款搭载ChatGPT的自行车问世

Urtopia 推出了一款新型电动自行车，名为 Fusion。这款自行车的特点是搭载了 ChatGPT，可以根据用户的输入，生成各种各样的回答。Urtopia 方面表示，Fusion 自行车是艺术和科技的融合。通过使用 Open AI 的技术，骑行者可以享受一种无缝的骑行体验，就像有一个随身的助手一样。骑行者可以向自行车提问，也可以跟它聊天，Urtopia 公司称之为“有思想的自行车”。

ChatGPT 艺术 OpenAI

2023-07-04

ChatGPT自行车来了？是「智商税」吗？

最近有消息传出，某品牌后续计划将推出「ChatGPT自行车」，而这一消息引起了不少网友的纷纷讨论。那么，在ChatGPT这类AI能力的加持下，自行车这类产品是否可以实现功能上的迭代优化？一起来看看本文的解读和分析。

ChatGPT

小雷哔哔 2023-07-17

我让ChatGPT预测了2023公路自行车器材发展趋势

最近爆火的ChatGPT是基于OpenAI研发的人工智能聊天程序，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代…

ChatGPT OpenAI 人工智能

骑行家 2023-02-16

自行车+ChatGPT主打“陪伴”？感觉哪里怪怪的

让自行车说话，有没有必要？

ChatGPT

元宇宙日爆 2023-07-07

AI绘画每日一(组)图：自行车

自行车是一种方便、环保、健康的交通工具，是人们出行的良伴。自行车的优点很多，首先它是一种环保交通工具，不会产生任何废气和污染，对环境和健康都有好处。其次，自行车出行非常方便，不需要像汽车一样等待红绿灯和拥堵，可以随时随地出发，更加灵活自由。此外，自行车还可以锻炼身体，提高身体素质，是一种健康的生活方式。自行车的种类也很多，有公路车、山地车、折叠车等，每种车型都有其特定的用途和特点。公路车适合在平坦的路面上行驶，速度非常快，可以达每小时几十公里。山地车则适合在不平坦的路面上行驶，具有较好的通过性和稳定性。折

AI绘画汽车

塔蒂丝之旅 2023-06-28

现在，ChatGPT能看图帮人修自行车了

01 ChatGPT的眼力

02 能说会道的GPT

03 能看能听，一定是好事吗？

推荐体验

相关资讯

首款搭载ChatGPT的自行车问世

ChatGPT自行车来了？是「智商税」吗？

我让ChatGPT预测了2023公路自行车器材发展趋势

自行车+ChatGPT主打“陪伴”？感觉哪里怪怪的

AI绘画每日一(组)图：自行车

近期资讯

vivo 副总裁胡柏山：华为手机拿回应该属于自己的份额

科学家尝试用 AI 开发世界上第一个虚拟人类细胞

AI 需求火爆，消息称台积电明年继续调涨先进制程、封装代工价格

三星集团今年市值蒸发161.25兆韩元！三星电子跌超30%成主因

灵初智能发布首个基于强化学习的端到端具身模型 Psi R0

年轻人集体涌进墨水屏，只是为了彻底“戒网瘾”？

英伟达计划 2025 上半年发布新一代人形机器人芯片Jetson Thor

首发麒麟5G、搭载卫星消息？华为这款千元机有点劲爆了！

2024年AI大牛，不爱大厂爱创业？

9 亿用户背后的秘密：Telegram 如何做到隐私与盈利两不误？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响