今天凌晨,ChatGPT 罕见地迎来了一次交互界面的大改。
没有颠覆式创新,奔着生产力革命的 ChatGPT Canvas 新功能隐约透着几分 Claude Artifacts 的影子。
Canvas 是一个全新的界面,旨在帮助用户与 ChatGPT 在写作和编码方面进行更紧密的协作。
对于这项功能,OpenAI 研究主管 Karina Nguyen 在 X 平台阐述了她的想法:
我心目中的终极 AGI 界面是一张空白画布(Canvas)。
它能够随着人类的偏好不断演变、自我变形,并发明出与人类互动的全新方式,重新定义我们与 AI 技术以及整个互联网的关系。
简言之,Canvas 就是一个更大的、更适合复杂工作的协作空间。
有意思的是,在 OpenAI 官网上,我们也发现了支持该新功能的领导团队包括了一些今年离职的熟悉面孔——Barret Zoph、John Schulman、Mira Murati。
而即日起,OpenAI 将向 ChatGPT Plus 和 Team 用户推出 Canvas。
Enterprise 和 Edu 用户则在下周获得访问权限。测试结束后,OpenAI 计划向免费用户推出 Canvas。
指哪改哪,写作能力更强了
写作和编码都是 ChatGPT 的两大高频使用场景。
尽管聊天界面简洁高效,适用于多种任务,但目前在处理需要复杂步骤和多方面技能的项目上显得有些力不从心。
Canvas 便提供了一种新的工作界面,用户可以在其中编辑和改进 AI 的输出。
OpenAI 官方表示,Canvas 能够让 ChatGPT 更懂你的心思,比如你可以高亮标注出重点部分,告诉 ChatGPT 特别关注哪里。
用官方的话来说,就像是旁边有一个文案编辑或代码审查员在实时地提供实时反馈和建议。
在 Canvas 界面中,你也可以轻松地编辑文字或代码。
页面还配备了快捷方式,让你可以要求 ChatGPT 调整写作长度、调试代码,并快速执行其他有用的操作。一键撤销,恢复到之前的原版本也轻而易举。
写作快捷方式包括:
建议编辑:ChatGPT 提供实时建议和反馈。
调整长度:编辑文档长度,使其更短或更长。
更改阅读水平:调整从幼儿园到研究生的阅读水平。
增加最终润色:检查语法、清晰度和一致性。
添加表情符号:添加相关的表情符号以强调和增加色彩。
杀鸡焉用牛刀,在小事上频繁调用 Canvas 反倒有些复杂。
通常情况下,Canvas 会在 ChatGPT 检测到可以提供帮助的场景时自动启用。当然,你也可以在提问时加上「use canvas 」来打开该功能。
据 OpenAI 介绍,比如在遇到像「写一篇关于咖啡豆历史的博客文章」这样的请求时,Canvas 会自动启动。
但如果是在简单的问答任务中,比如「帮我做一个新晚餐食谱」,那么启动 Canvas 就有些小题大做了。
为什么说 Canvas 功能能够提升写作质量和改善交互体验?
官方表示,类似于质量监控系统,开发团队设置了超过 20 个自动化测试来追踪他们的 AI 在开发过程中的表现。
在开发过程中,研究团队使用前不久推出的 OpenAI o1-preview 版本来生成合成数据,然后用作后训练的数据集,从而加强模型的关键功能,比如写作和与新用户的互动。
真·AI 程序员来了
考虑到编码通常不是一次性完成的,而是需要多次修改和改进。
Canvas 的目的是让追踪和理解 ChatGPT 所做的修改变得更加简单明了,并且未来 OpenAI 将进一步考虑提升编辑过程的透明度。
编码快捷方式包括:
审查代码:ChatGPT 提供实时建议,以改善代码。
添加日志:插入打印语句以帮助调试和理解代码。
添加注释:为代码添加注释,以便更容易理解。
修复错误:检测并重写有问题的代码以解决错误。
移植到其它语言:将代码翻译成 JavaScript、TypeScript、Python、Java、C++ 或 PHP。
在编码任务中,为了避免干扰经验丰富的开发者,Canvas 也不应该那么频繁地调用。OpenAI 特意在这方面进行了改进,使得它在写作和编码任务中更准确地触发 Canvas,分别达到了 83% 和 94% 的准确率。
目前,基于 GPT-4o 模型构建的 Canvas 仍处于早期测试阶段,用户可以在模型菜单栏中切换体验该功能,OpenAI 宣称将迅速改善其功能。
除了教会模型要适当地启动,研究团队还要教会其如何更聪明地编辑内容。
当 Canvas 启动后,模型需要判断:是只修改内容的某些部分,还是全部重写。
因此,如果用户在界面上明确指出了要改的地方,模型就会只修改那些部分。而如果用户没有特别指出,模型就会选择重写整篇内容。
终极的 AGI 界面——空白画布
Karina Nguyen 也分享了 Canvas 的一些实际使用案例。
GPT-4o 结合 Canvas 可以研究艺术史并撰写报告,可以要求验证其观点并添加引用文献。
GPT-4o 结合 Canvas 可以编写 Rust 代码并进行代码审查。
浏览食谱后,Canvas 可以根据现有的食材创造新菜谱。
OpenAI 开发者大会的狂欢仍在继续。
Canvas 功能的着力点依然牢牢锁定在内容创作和编码开发过程。
独立窗口的设计自由度更高,能够让我们能够直接在主界面上与复杂内容进行互动和管理,这不仅极大优化了用户体验,也让我们看到了人机交互的未来。
只有简单问答功能的 AI 服务,已经跟不上人类「副驾驶」的第一梯队了。
随着 Claude Artifacts、Cursor 等功能/工具的爆火出圈,Canvas 功能的推出也是为了补上市场竞争的重要一环。
OpenAI 人机交互的「弹药库」依然充足,也依然春风得意。