10分钟定制一个「陈天奇GPT」，OpenAI新品大波实测来袭！Sam Altman降维打击，千家AI初创公司入土

作者：新智元发布时间：2023-11-08

OpenAI 阿尔特曼

10分钟定制一个「陈天奇GPT」，OpenAI新品大波实测来袭！Sam Altman降维打击，千家AI初创公司入土

新智元报道

编辑：编辑部

【新智元导读】OpenAI引爆了核弹，让任何人都可以使用自然语言在几分钟内构建应用程序！爆炸性的革命时刻，真的来了。

OpenAI首届春晚，创业公司屠杀夜。

正如Sam Altman所言：「我们正在孕育新物种，它们正在迅速增殖。」

可以说，基于OpenAI接口构建创业公司，产品忽然就失去了意义。许多初创公司的产品，已经没有了护城河。

杜克大学教授陈怡然表示，照这个趋势，所有希望在细分领域依靠领域知识和OpenAI掰腕子的人，都是死路一条，至少在学术界和中小公司几乎不可能。

OpenAI只要找到一个合作方，或者在公开领域能找到相应的训练集，剩下的就是降维式打击。

不过，使用自己的数据集来训练一个定制版GPT-4可不便宜——起步价200-300万美元。

此外，如果想得到比较理想的效果，最好是拥有极其庞大的专有数据集（至少数十亿token）。

随着OpenAI的史诗级发布，微软的股价连续上涨8个交易日，并在周二收盘时创下360.53美元的历史新高。

而1.12%的日涨幅也让其市值达到了约2.68万亿美元。

OpenAI说，这是我们梦寐以求的未来。如果说以前是「让你的钱为你工作」，现在就是「让你的AI为你工作。」

初创公司「一夜回到解放前」

OpenAI刚刚官宣进入Agent战场，所以，全球十家头部Agent初创公司接下来该做什么？

看完下面这批API演示，你就会明白，为什么说「OpenAI一更新，千家初创公司要倒闭」。

曾经有人预测，ChatGPT，终将成为一个为集Midjourney、PDF Chat、Perplexity AI和高级数据分析于一体的「AI超级应用程序」

定制GPTs，但没全部开放

号称最最重磅的更新「GPTs」让人人都可以不用编程，仅通过对话聊天方式，就打造一个专属个性化的GPT，还可以通过「GPT商店」赚钱，果真有这么神奇？

Altman本人亲自在现场登台演示，几步操作就创建了一个「创业导师GPT」，用时才3分钟不到。

惊艳的是，「创业导师GPT」根据Altman本人的演讲风格，给出了回答。

目前，「GPT商店」已经上线了由OpenAI开发的16个机器人，包括数学导师、创意写作教练、助理厨师等等。

上下滑动查看

那些已经拿到内测资格的网友，已经开启了一大波应用。

英伟达高级系统软件工程师Bojan Tunguz用时10分钟，创建了一个ChatXGB——一站式XGBoost助手。

就比如，当你问它「XGBoost guy指的谁」？答：XGBoost guy就是陈天奇.....

ChatXGB给出100%正确的答案。

曾创建了火爆的BabyAGI的网友，这次又定制了一个世界首个自定义GPT智能体「Agi.zip」。

创建这个GPT时，他发现GPT-4-turbo不够快，还使用了添加了20个预构建的热键以加快速度。

自动保存

- 长期记忆

- 可重用技能

- 跟踪当前任务

- 使用.sql导出到任何聊天中

现在，不用动手操作，只需动动嘴，真正的AGI来了...

还有创建「X Optimizer GPT」的网友，用其来优化X帖子。

它可以微调推文，并确定高峰发布时间，以便在X上获得最大的参与度。

OpenAI官方发布的「HotMods」——可以把你上传的图像改编成一种全新的画风，如下是网友体验的效果。

不过，对于大多数人来说，ChatGPT依然是下面这个状态：「不好意思，我还没准备好」。

API、TTS，网友脑洞大开

与此同时，随着海量新功能的发布，OpenAI创始人Greg Brockman也兴奋地转发了网友们各种脑洞大开的应用案例。

和GPT视频聊天

比如，使用OpenAI的vision API，我们就可以用网络摄像头和ChatGPT玩「你画我猜」了。

开启「视频」后，小哥问ChatGPT：你看到了什么？

它很流利地描述起摄像头里的画面：我看到一个留着短发的年轻男人坐在墙边，他直视着镜头，身穿一件黑色的T恤。

这位小哥拿起一副墨镜，向摄像头对面的ChatGPT展示了一下，然后问它：我拿着什么？

ChatGPT回答说：你拿着一副墨镜。

类似的，也有网友做出了差不多功能的应用。

对此，有网友表示，这种工具或许可以用来帮助盲人「看」到真实的世界。

对于盲人来说，这将是一个很好的工具，如果它能像个人助理一样用语音应答，就能引导他们去寻找丢失的物品或其他东西。

GPT-4V + TTS = AI解说员

而将OpenAI的视觉和语音API相结合，还可以直接让AI变身为足球解说员！

比如，把一场足球比赛视频的每一帧都传给了GPT-4-vision-preview，只给了它一些简单的提示，要求它生成旁白。

GPT-4V完美地做到了，配合上TTS的解说，一场现成的体育解说视频就这样出炉了。这个视频完全没有编辑，是从模型中直出的。

这个视频总共有1131帧，每10帧选一张图发给GPT，总共花了30刀。

具体来说，首先提取视频帧，然后创建一个结构化提示，定义GPT请求的参数，包括模型、提示信息、API密钥、最大token限制，然后发送GPT请求、制作语音解说提示、生成语音解说脚本，向TTS API发送请求将脚本转换为音频，再将音频和视频结合就可以了。

有人表示：30刀替代一个体育解说员，这很疯狂。

除了体育比赛外，还可以利用GPT-4 API识别画面进行游戏解说，比如英雄联盟。

前方「高血压」预警：视频里是LNG打T1那场……

完整版如下：

网友点评：如果能让叙述速度加快，再加入一些感情，那看起来就跟真人解说相差无几！

「这是我迄今为止看到的GPT Vision的最佳用例。」

GPT版浏览器

网友将GPT-4V的能力与浏览器相结合，就可以随意圈图，获得解答。

比如，它可以帮助你学习解剖学，数学、汽修等等。

而将上网功能与自定义GPTs结合，则可以从自己最喜欢的音乐人中创建音乐播放列表。

GPT瑜伽教练

通过GPT-4V API可以让ChatGPT成为你的瑜伽教练。

不需要再付讲师费，也能做出标准的动作。

简单勾勒，设计HTML

更厉害的是，通过GPT-4V API可以在5小时内将低保真度模拟与实际HTML的流程组合在一起。

假设你自己做一个全新的推特界面，就可以简单勾勒出结构，GPT-4V瞬间就做成了HTML。

GPT-4V加持的多模态RAG

LangChain平台认为，虽说一张图片胜过1000个字，但图像在RAG应用程序中通常是不可见的。

GPT-4V等多模态LLM恰恰解锁了使用图像的RAG应用程序。

使用新的GPT-4V API，LangChain将在本周发布模板和说明书，以重点介绍多模态RAG的几种方法：

选项 1：多模态嵌入检索

- 优点：直接嵌入最高质量的b/c图像检索潜力

- 缺点：多模态嵌入的选项更少

选项 2：生成图像摘要

- 优点：简单，因为它使用文本嵌入，并且不依赖多模态LLM进行答案合成

- 缺点：信息丢失，因为图像不直接用于答案合成或检索

选项 3：检索图像摘要，但传递图像进行合成

- 优点：文本嵌入简化了检索，但在答案合成中仍然使用图像

- 缺点：嵌入了检索b/c图像摘要中的潜在质量损失

这些方法可以对带有图像内容的文档（如教科书、财务报告、技术手册等）启用 RAG。

TTS普通话一级过了

国外小哥在HuggingFace上提交了一个个OpenAI新发布的TTS文字转语音，可以直接体验。

有5种男声和2种女声可以选择。

不如，咱们就用普通话等级考试中的练习题考考TTS的能力如何？

体验地址：https://huggingface.co/spaces/ysharma/OpenAI_TTS_New

更震撼的是，TTS模型还能精准把控标点符号的含义，生成语音的语气各不相同。

助手API

一位开发者使用了Assistants API构建了一个开源「GPTvsGPT」，只用了109行Python代码。

GPTvsGPT是一个有趣的应用程序，可以模拟2个个性鲜明的人工智能助理之间的对话。

令人兴奋的是能够通过检索、数据和自定义函数来扩展这些功能。

他还让DALL·E为此设计了一个LOGO。

另外一位开发者更是用了不到30行的代码创建了网站。

此外，用AI Assistants和GPT-4-1106还可以构建一个AI简历分析器和评分工具。

目标是，通过使用 AI 来评估候选人是否合适，从而节省宝贵的招聘时间。

在演示视频中，网友上传了两个文件：职位描述和候选人简历。

总有一天，人工智能只会为人们挑选工作......无需过滤简历。简历将成为过去......

不过，开发者想要利用OpenAI的Assiatant API，在自己的应用程序中构建个性化的Agent并不便宜——存储数据的成本高达0.20美元/GB/助手/天。

与每月每GB约0.023美元的S3相比，OpenAI的定价要高出260倍！

谷歌，现在到你了

面对OpenAI的挑战，英伟达高级科学家Jim Fan表示，DeepMind是时候重现2016年AlphaGo的辉煌了！

现在，大家对谷歌Gemini的期望高得离谱。

不过，它至少做到以下一点，并在2024年第一季度发布API，才能与GPT分庭抗礼：

- 文本能力达到GPT-4的120%；

- 水平能力达到GPT-4的100%，但成本只有turbo的一半或速度是turbo的2倍；

- 视觉能力达到GPT-4的100%；

- 本地支持长视频。

相比之下，Meta也只需开源Llama-3即可。

目前，谷歌已经对Bard进行了多次迭代。谷歌DeepMind也在内部开发了一些SOTA的基础模型，如UL2、PaLI、PaLM、Flamingo等。

所以，这理论上是有可能的。

参考资料：

https://twitter.com/gdb/status/1721972696412573956

https://twitter.com/gdb/status/1721709452011655467

近期资讯

如何轻松解压7z文件：详细步骤与工具推荐指南

好了，今天我们聊一聊如何解压缩一个7z文件。也许你已经遇到过这种情况，朋友或者同事给你发了一个7z格式的压缩包，结果你一头雾水，不知道该怎么打开它。别担心，接下来我会一步一步教你怎么搞定这个问题。首先，什么是7z文件呢？7z是一种由7-Zip软件创建的压缩文件格式，通常它的压缩率比较高，能把文件压得更小。

新报观察 2024-12-29

手机颜色不对怎么调整

在我们的日常生活中，手机几乎成了必不可少的工具。这种情况不仅让人感到困扰，也影响了我们使用手机的乐趣。那么，手机颜色不对的时候该怎么调整呢？

新报观察 2024-12-29

如何通过电脑高效操作手机的多种方法与技巧

在现代社会，手机和电脑几乎是我们生活中不可或缺的工具。手机让我们随时随地保持联系，而电脑则提供了更大的屏幕和更强的处理能力。有时候，我们可能会想，能不能用电脑来操作手机呢？答案是肯定的！接下来，我就来聊聊如何通过电脑来操作手机，帮助你更高效地使用这两种设备。最直接的方法就是通过USB线将手机连接到电脑。

新报观察 2024-12-29

如何轻松查看vivo手机上的WiFi密码，实用方法全解析

在日常生活中，WiFi已经成为我们不可或缺的一部分。无论是在家里、办公室，还是在咖啡馆，WiFi都为我们提供了便捷的网络连接。不过，有时候我们可能会忘记WiFi密码，尤其是当我们需要连接其他设备时。这时候，如何查看vivo手机上的WiFi密码就成了一个很实用的问题。接下来，我就来和大家聊聊这个话题。

新报观察 2024-12-29

如何轻松安装小米摄像头内存卡，保障家庭安全

在现代家庭中，智能摄像头已经成为了很多人安全防护的首选。不过，很多新手在安装和使用过程中，常常会对内存卡的使用感到困惑。今天，我们就来聊聊小米摄像头内存卡怎么安装，这个过程其实并没有想象中那么复杂。

新报观察 2024-12-29

手机测量长度功能的实用性与注意事项解析

手机测量长度的功能越来越受到大家的欢迎，尤其是在日常生活中，很多人都希望能用手机来代替传统的尺子或者卷尺。毕竟，手机是我们随身携带的工具，能随时随地帮助我们解决问题，测量长度也不例外。现在，很多手机都内置了测量应用，或是通过下载其他软件来实现这一功能。接下来，就来聊聊手机是怎么测量长度的，以及我们在使用过程中需要注意些什么。

新报观察 2024-12-29

如何在WPS Office中轻松调整行间距提升文档美观性

在日常办公中，WPSOffice是一个非常常用的办公软件，它的功能强大，操作简单，深受用户喜爱。如果你选择“多倍行距”，你可以输入一个小数，比如“1.2”，这样行距就会根据你输入的倍数进行调整。

新报观察 2024-12-29

如何顺利绑定微信账号，享受便捷生活的全面指南

在这个信息化的时代，微信已经成为我们生活中不可或缺的一部分。无论是聊天、购物、还是支付，微信都能为我们带来很多方便。而绑定微信账号是使用这个应用的第一步，让我们来聊聊怎么绑定微信吧。首先，下载微信应用是必须的。如果你是安卓用户，可以在应用商店中搜索“微信”，然后点击下载。

新报观察 2024-12-29

掌握图片设置技巧，提升视觉效果与使用体验的实用指南

不过，很多人在使用图片时，可能会遇到一些问题，比如怎么设置图片的大小、格式、清晰度等等。如果你在做一个PPT或者博客，图片太大可能会导致加载缓慢，影响观众的体验；而如果太小，可能会模糊不清，让人看不清楚细节。

新报观察 2024-12-29

如何在CorelDRAW中轻松绘制美丽的波浪线技巧

在绘图和设计的过程中，波浪线是一种常见的元素。无论是在图表、插图还是其他视觉作品中，波浪线都能增添一种动感和活力。今天，我们就来聊聊如何画出漂亮的CDR波浪线。CDR是CorelDRAW的文件格式，很多设计师和插画师都喜欢用它来进行矢量图形设计。接下来，我们将一步一步地探讨如何在CorelDRAW中绘制波浪线。

新报观察 2024-12-29

10分钟定制一个「陈天奇GPT」，OpenAI新品大波实测来袭！Sam Altman降维打击，千家AI初创公司入土

10分钟定制一个「陈天奇GPT」，OpenAI新品大波实测来袭！Sam Altman降维打击，千家AI初创公司入土

推荐体验

相关资讯

用AI五分钟就能生成一档播客？感觉降维打击了。

教你10分钟开发一个AI聊天助手

GPT-4 Copilot X震撼来袭！AI写代码效率10倍提升，码农遭降维打击

【20分钟完整版】OpenAI CEO Sam Altman MIT访谈

行业前沿｜GPT-4 Copilot X震撼来袭！AI写代码效率10倍提升，码农遭降维打击

近期资讯

如何轻松解压7z文件：详细步骤与工具推荐指南

手机颜色不对怎么调整

如何通过电脑高效操作手机的多种方法与技巧

如何轻松查看vivo手机上的WiFi密码，实用方法全解析

如何轻松安装小米摄像头内存卡，保障家庭安全

手机测量长度功能的实用性与注意事项解析

如何在WPS Office中轻松调整行间距提升文档美观性

如何顺利绑定微信账号，享受便捷生活的全面指南

掌握图片设置技巧，提升视觉效果与使用体验的实用指南

如何在CorelDRAW中轻松绘制美丽的波浪线技巧

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响