当前位置:首页|资讯|ChatGPT

任何人都能轻松定制GPT!AI进入“APP Store”时刻

作者:电脑报发布时间:2023-11-22

原标题:任何人都能轻松定制GPT!AI进入“APP Store”时刻

01

OpenAI商业化野心藏不住

把应用层牢牢锁在自己的生态中,OpenAI又一次给如火如荼的大模型竞争赛带来冲击。

GPT-4 turbo主打“物美价廉

11月7日,美国旧金山OpenAI总部,创始人兼首席执行官山姆·奥特曼(Sam Altman)在首次开发者大会上用45分钟密集发布了最新的GPT-4 Turbo大模型版本,以及一系列开发者工具和“GPTs”的各类定制版本。

在“一分钟诞生一个新GPT应用”的号召下,全球开发者再度涌向ChatGPT。大会刚结束,ChatGPT就出现宕机情况,经过两个半小时才解决问题;新功能上线第二天,ChatGPT再度出现严重宕机,一个半小时后才恢复。奥特曼在社交媒体上为宕机事件致歉,无奈表示“新功能使用情况远远超出预期,由于负载原因,ChatGPT短期内仍可能会出现服务器不稳定的情况”。

新版GPT大模型为什么有如此大的吸引力?简单总结,GPT-4 Turbo大模型相比于此前的版本性能更强、速度更快,就像业内人士评价所说,它有目前最强的自然语言处理、上下文理解以及生成连贯且类似人类响应的能力。最重要的是GPT-4 Turbo“大降价”,这无疑将会为广大开发者提供更加经济实惠的AI服务。

GPT-4 Turbo大模型性能纬度中最受关注的,莫过于超长上下文的支持能力。官方口径下,GPT-4 Turbo大模型支持上下文窗口(context window)的能力从目前GPT-4的32K,即支持3000英文单词左右的长文理解,提升至128K。128K的文本长度是什么概念?那可是300多页的长文本内容,再多点就能直接写书了。

不过,能容纳超长的内容,不等同于大模型真的可以完美地消化理解。11月9日,美国一位专业开发者用英国计算机科学家Paul Graham的论文作为文本内容,在文本不同位置插入同一句话,要求ChatGPT-4 Turbo只能用这个论文作为回答的依据回答相同问题,以检测GPT-4 Turbo在超长上下文中准确定位信息的能力。

GPT-4 Turbo的长文本的阅读、理解与推理能力虽强于前任版本,但仍有缺陷

经过15次测试后测试人员发现,ChatGPT-4 Turbo在输入文档超过73K tokens(字符)之后下降明显,这意味着如果你的文档超过了5.4万个英文单词,之后的内容GPT-4 Turbo并不能准确理解。所以如果想让大模型理解并准确回答你的问题,要么上下文长度有所控制,要么将重要内容放到文本的开头部分。

除了超长文本容纳能力,奥特曼还提到ChatGPT-4 Turbo版将训练数据集从GPT-4时的2022年1月更新至了今年4月,用户可以就今年4月前的知识和AI互动,时效性更强。

性能的整体优化,帮助GPT-4 Turbo实现了比GPT-4更低的Token价格。OpenAI官网显示,目前支持32K理解能力的GPT-4模型每千Tokens API(应用程序接口)调用输入价格为0.06美元,输出价格为0.12美元;而GPT-4 Turbo每千Tokens API调用输入/输出价格分别降至0.01美元/0.03美元。

性能提升带来大幅降价

此外,支持16K理解能力的GPT-3.5 Turbo模型每千Tokens API调用输入/输出价格分别由0.003/0.004美元,下调至0.001/0.002美元;GPT-3.5 Turbo模型微调版本每千Tokens API调用输入/输出价格也分别由0.012/0.016美元,下调至0.003/0.006美元,训练价格则维持0.008美元不变。

英伟达资深AI科学家Jim Fan就直接表示,OpenAI的规模经济给它带来了致命优势,“使用GPT-4 Turbo阅读《哈利波特》系列只需15美元,而让它再写7部小说也只需45美元”。

C端个性化级

作为普通的C端用户,除了通过与ChatGPT对话感受到大模型的迭代进步,创造出自定义版“GPTs”无疑增添了更多乐趣。

用户可以在ChatGPT界面看到自制GPT应用的提示

Open AI发布会第二天就上线了GPTs,所有ChatGPT Plus订阅用户都可以通过GPT Builder创建和定制个性化GPT应用。GPT Builder提供的是一个直观易用的界面,用户无需编程知识只需要聊天,或者简易指示图即可进行定制。

至今最受欢迎、点击率最高的几款GPTs

现场展示中,GPTs就像一个万能打工人。比如,CanvaGPT(基于设计工具网站Canva定制)可以帮用户设计海报、新logo等;ZapierGPT(Zapier致力于工作流程自动化)可以连接和控制手机里的各种App,有点类似iPhone手机中的快捷指令,可以帮你安排日程、调整冲突日期,甚至帮你在微信上和同事解释你不能参加会议的原因;最后一个案例是创业咨询师,这是用自然语言与ChatGPT沟通而生成的专业化咨询师。

值得一提的是,AI模型早已经进入坐拥数据富矿的金融行业,但是金融业一直对ChatGPT在这一领域的作用表示怀疑,因为ChatGPT仍然一种通用模型,训练的时候并没有专门以金融投资为目的。如今几句话就能轻松创造出一位“专业人士”,未来想训练更符合细分领域需求的“咨询师”乃至模型,比如说宏观市场的、大宗商品的、细分行业的,岂不是更容易?

奥特曼也确实提到,除了C端可以创造个性化GPTs,OpenAI还启动了自定义模型计划,企业客户、行业组织可以申请OpenAI研发团队为其定制模型,“提供给OpenAI的数据不会在其他任何环境中重复使用”。

GPTs新功能发布不到24小时,网上各路大神的自定义GPT已经开卷。从可以帮助用户创建并托管网站的“Designer GPT”,到可以分析股市曲线图判断买卖时机的“Market Analyst GPT”;再到可以保留画作最核心内容,但同时生成其他不同风格图片的“Drawn to Style”;还有能够快速根据你上传的实物照片生成菜谱的“Recipe Snap GPT ”……

只有你想不到,没有做不出来的应用,这也解释了为什么ChatGPT为什么短时间内会出现多次宕机。

最具潜力的商业模式

技术的进步、C端的应用趣味性并不是这次发布会最受关注的信息,OpenAI在围绕自身构建AI生态方面的一大步才是令其他科技企业为之震动的根本原因。

在短短45分钟的发布演讲中,奥特曼还提到了一个重磅消息:GPT Store将在本月底上线,开发者可以通过上架应用的方式获得收入,“接下来几个月,你开发的GPT有多少人使用就决定了你的收入”。

上述GPTs只是一个工具,用户可以通过这个工具开发自己的GPT应用;但GPT Store则是一个高度近似苹果商店的平台,用户可以在其中分享、购买和下载定制的模型,一旦上架,开发者的GPT应用就从单纯自娱自乐变成了商业产品。

这也宣告业界此前的担心成了定论。ChatGPT去年11月火出圈后,今年3月1日宣布开放ChatGPT API接口,允许第三方开发者通过API将ChatGPT功能集成到自己的应用程序和服务中时,就有业内人士预测Open AI想做的不仅是底层语言大模型,还要把应用层纳入其生态之中。

语言大模型、大模型的精调和基于大模型的应用开发被业内广泛认为是AI2.0时代的三个机会,Open AI显然有更大的野心。宣布开放API接口不久,3月24日,OpenAI宣布ChatGPT将上线插件测试,包括OpenAI自己的互联网浏览器、代码解读器、本地文档上传三个应用插件,以及OpenAI和第三方合作的12款应用插件。

一位国内AI创业公司负责人彼时曾解释,鉴于此前OpenAI已经封闭算力,算法等信息,OpenAI想打造封闭的生态系统的目的已经非常明确,“插件功能就像是简陋版的苹果应用商店,开发者可以在ChatGPT生态中加上自己设计的插件,这样其他用户可以通过ChatGPT使用所有插件”。从官网上看,OpenAI至今已经有上千个插件上线。

这也意味着,如果开发者拥有更多盈利空间,OpenAI就可以快速扩大自己的生态,并像苹果收取“苹果税”一样收取“GPT税”来获得超额盈利。GPT Store的上线印证了这一点。

所谓“苹果税”,是指在App Store上年收入在100万美元以上的App中,苹果对应用内发生的数字内容消费收取30%的分成,年收入在100万美元以下的中小开发者抽成比例则为15%。苹果税的毛利率长期维持在70%以上的高水平,可以说是苹果最吸金的生意。

另一方面,OpenAI这次更新迭代对于某些人工智能初创企业来说可能不是个好消息。AI领域咨询师Abhishek Agarwal在自己的社交平台总结了一些可能会被“灭绝”的AI创业公司。

首先就是专注开发闭源大型语言模型(LLM,large language model)的项目或企业,比如Bard、Cohere等;其次是文本转语音的API,毕竟OpenAI都已经能提供6种不同的类人语音的文本转语音API了;还有就是专座矢量数据库的网站,比如Pinecone、Chroma,因为ChatGPT已经支持RAG(检索增强生成)可以随时检索数据并生成相关数据模型。

当然,也不是所有科技企业都放弃了与OpenAI的竞争,资金雄厚的人工智能初创公司和科技巨头正在迎头赶上。就在GPT-4 Turbo公开上线的前两天,OpenAI早期支持者埃隆·马斯克旗下的AI公司“xAI”发布了首个AI大模型Grok。

Grok或将成为GPT-4最有力竞争者

公告称,Grok仍是一个非常早期的测试产品,毕竟是只用2个月的训练就开发出来的,但Grok已经在科技圈引起轰动。比如,Grok的主要优势之一是其泛化和适应新任务和领域的能力。传统的人工智能模型在面对不熟悉的场景时往往会陷入困境,需要进行大量的微调或重新训练,而Grok的强化学习能力使它能够快速适应各种环境并表现良好。

因此,尽管它们的底层技术、训练方法和整体理念都有不同,但在业内人士看来,Grok将是GPT-4最有力的竞争者。

02

十字路口上的国内AI企业

“OpenAI将杀死应用创业公司”——随着OpenAI向世界彻底展露出自己的野心和能力,大批AI应用已经失去了护城河,国内狂飙猛进的AI企业也来到了十字路口。

向左走:卷生态

在ChatGPT持续引爆行业通用大模型之后,国内诸多互联网巨头、AI企业,也都选择纷纷跟进,参与到国产通用大模型的角力之中。但需要注意的是一个成功的且可对外商业化输出的通用大模型,要求厂商拥有全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措,以及生态开放性等核心优势,这意味着大部分公司不具备做通用大模型的能力,唯有BAT这样的巨头才更适合做通用大模型,而拥有丰富场景数据积累的公司更适合做垂域模型。

与上半年“热闹非凡”的行业境遇不同,具备实力且具备满腔“产业抱负”的巨头玩家,不再局限于聊天、答题、内容生产等C端应用,而是转向更偏重实体领域的B端应用,推动整个“大模型+”应用时代的来临的同时,生态阵营的比拼成为通用大模型巨头玩家的主攻方向。百度、阿里都希望成为“大模型的底座”去赋能行业与企业。但并不是所有企业都有这样的能力。

在生态的构建方面,B端市场是大模型企业重点布局的领域。早在今年4月发布通义千问1.0版本时,阿里云就已经在期待这个超大规模语言模型在B端市场的价值。“所有软件都值得接入大模型升级改造,”周靖人当时称:“我们将开放通义千问的能力,帮助每家企业打造自己的专属大模型。”阿里自身业务当时也率先被拿出来试水打样。继钉钉和天猫精灵率先接入测试后,阿里电商、搜索、导航、文娱等场景也陆续接入。而腾讯混元大模型早期更是只针对B端市场开放,本身定位就是作为腾讯云MaaS服务的底座,让客户可以直接通过API调用腾讯混元模型,也可以将腾讯混元大模型作为基底模型,以适配不同的产业场景。

B端行业客户一直都是大模型们重点布局的对象

在B端领域,大模型企业通过模型即服务(MaaS)解决方案,提供涵盖模型预训练、模型精调、智能应用开发等一站式的行业大模型服务,帮助不同产业企业开发自己的大模型,最终构建属于自己的生态,只不过这样的合作形式推进较慢,毕竟B端企业从立项到选择合作伙伴再到行业垂直大模型的研发,均需要时间。

相对于B端合作,巨头旗下已有产品和服务同大模型的融合能更好地推动通用大模型的落地,通义千问发布的同时,阿里云智能CEO张勇就表示,阿里所有产品未来将接入该大模型。文心一言通过备案后,已可以在百度网页搜索中通过“ai对话”的方式使用,而9月才正式亮相的混元大模型如今已接入超过180个腾讯内部业务。

这类自有生态的融入往往给终端用户“悄然无声”的感觉,如腾讯QQ浏览器的“PDF阅读小助手”,融入腾讯混元大模型后,其在终端给用户的表象仅仅是浏览器右上方工具栏中多了一个蓝色十字星小图标而已。不过阿里钉钉在融入通义大模型后,其从界面到功能设计都发生了较大变化。新一代个人版钉钉初步整合“空间、AI、云盘、会议” 4 项功能,同“我来 wolai”进行了完美融合。

融合通义大模型的钉钉个人版变化极大

钉钉个人版的AI既可以融入“空间”中为用户内容生成服务,又属于单独的板块,用户可以在其中进行AI对话、绘图等操作。钉钉个人版的AI功能主要由“贾维斯”文生文 AI 和“缪斯”文生图 AI 构成,用户可以通过自然语言与 AI 进行对话,解答问题、制定计划,甚至进行绘画创作。这样的融合既是将通义大模型同阿里生态应用相结合,又是将在通义大模型基础上开发的应用嵌入阿里旗下应用,打开了终端应用的成长空间。

除了以上两种生态构建模式外,腾讯、字节这样的巨头同样在打造类似“App Store”的C终端应用生态。在以微信小程序身份出现的“腾讯混元助手”操作界面上,详细罗列了工作、编程、绘画、营销等近十个细分赛道,用户可根据具体的应用需求,让“腾讯混元助手”以不同的应用角色出现,从而带来更具针对性的内容,而这背后的技术支持无非是基于腾讯混元助手开发的各种细分应用。

国内巨头均有搭载AI应用平台的尝试

这样针对C端的应用生态打造上,字节系反而显得更为激进一些,其大刀阔斧地对旗下“悟空搜索”进行改革,除更名为“小悟空”外,更直接改变了信息搜索引擎定位,转变为“AI工具库”。启动“小悟空”后可以看到,其块状界面设计更类似应用商城,其顶部为智能工具区,分类包括创作生成、学习提升、工作职场、专业咨询、虚拟角色、休闲娱乐等六个类别,每个类别中显示有其中的工具数量。

内卷生态的同时,国内巨头旗下的同样大模型也得到了快速成长的机会。相比GPT-4等国际顶尖大模型,国内大模型虽起步较晚,但随着国内大模型的加速发展,参数量、训练量的堆积,部分国内大模型已经可以与国外大模型同台竞技。从参数量来看,智谱旗下的Chat GLM2-130B的参数量达到1.3万亿,仅次于GPT-4,文心一言4.0的参数量也跻身万亿级别;从性能来看,文心一言、通义等大模型在CLiB测评中的表现要好于Meta的LLaMA-2-70B大模型,与GPT-4的差距较小。

此外,相对于掌握绝对话语权,开源或许是通用大模型构建生态的另一个思路,尤其是Meta向世界开源了Llama 2并允许免费被用于商业领域之后,通用大模型的“ Linux时刻”被频繁提及。算力不足可以说是大模型开源的根本原因,“算力总需求=场景数×单场景算力需求”的客观条件下,大模型在参数体量庞大的情况下,其推理成本也很高,普通公司难以维持其日常开销,因此,降低模型参数体量可进而降低企业在使用模型时的推理成本。开源大模型成为企业高性价比的选择,而放出开源大模型的通用大模型企业,也能凭借“免费”快速构建生态,高效利用算力的同时也能够获得足够的数据用于开源大模型的训练。

大模型开源为下游生态的蓬勃生长提供了绝佳机会,在细分产业的开发下,大模型开始在特定任务上深化开发。自开源大模型LLaMA推出后,基于LLaMA预训练模型微调的下游专业化模型开始浮现,例如医疗问诊领域中的华佗。

华佗是基于中文医学知识的LLaMa指令微调模型,在智能问诊层面表现出色, 可生成一些更为可靠的医学知识回答

华佗或将是未来开源大模型下游的特定任务模型发展的范式,即采用低参数体量的小型开源大模型作为基础模型,加之以特定专业领域的数据进行训练,得到表现更好的细分领域模型。当然,开源大模型在通用性上表现较差,短时间内无法与大型模型抗衡,加之目前难以系统评价模型的具体性能,市场对开源大模型持观望态度,依旧需要时间来证明自己的性能和优势,不过可以肯定的是因为开源大模型的出现,AI应用赛道会变得更加拥挤。

向右走:卷应用

百度董事长兼CEO李彦宏曾说:“创业公司卷大模型没有意义,卷应用机会更大。”言下之意,大模型交给大厂,创业公司搞应用创新,而这已然成为当下国内众多中小AI企业选择的成长路径。对于选择“卷应用”这条路的国内AI企业而言,方向和赛道非常重要,OpenAl的这次更新,基本宣告了大多数应用层公司上半年的探索,只是在做无用功,因为功能上大家用ChatGPT就够了,而比用户增长,谁又比得过ChatGPT呢?

相对于携通用大模型卷生态的巨头,终端服务应用也成为不少国内AI企业的选择,在细分赛道的深耕细作,同样有望在即将到来的AI时代掌握足够的话语权。在AI+办公领域,Microsoft 365 Copilot成为领航者的同时,国内WPS AI则接入多个大模型供应商,来满足用户 Al创作需求,目前已接入 MiniMax、百度文心、CopyDone等大模型,实现智能辅助写作、全文翻译、图像识别等功能。

深耕办公赛道的WPS AI具备平台化的趋势

全面覆盖用户日常办公应用的WPS AI如今已有了平台化的趋势,垂直应用成为金山、福昕PDF等行业软件同AI融合的趋势与方向。而万兴科技则将自己定位为“数字创意工具龙头”,以视频创意为核心布局全产业链,目前面向全球海量用户提供视频创意、绘图创意、文档创意、实用软件四大类产品,万兴喵影、万兴PDF等产品成为爆款产品的同时,不断创造更多细分领域的轻量化的工具,产品和服务向更深处发展,实现产品解决方案的本地化,具有极强的平台化意识。当然,万兴科技不少细分工具赛道也是新兴创业企业的首选,如专注AI阅读理解的“司马阅”、专注视频剪辑的“剪映”等。

万兴科技逐步成为细分工具平台企业

除以上两种走平台化、生态化的应用企业外,深耕影视娱乐的中文在线、专注图像处理的美图等企业,同样打开了AI企业新的成长空间。AI不仅能够帮助企业提高内容生产的效率,也能生成更加丰富多元、动态且可交瓦的内容进而优化传统互动模式。AI 正从激发生产力、打造新内容、构建新体验多层面重塑着数字文娱行业,前不久爆火的妙鸭相机便是AI应用孵化的现象级产品。

总体而言,加入 (加入OpenAI生态)和对抗(拥抱开源如Meta)成为国内AI应用赛道上企业的两个选择,这有些类似手机时代的苹果和安卓。当OpenAl在发布会祭出“GPTs”和“all tools”两个大招时,场内掌声雷动,但场外愁云惨淡。原因在于,大量创业项目在OpenAI更新后,已经失去了竞争力。

当然,业界也有另一种声音认为在OpenAI公布大模型最新进展后,反而让问题简单明了。原先OpenAl就像一把悬在创业公司头上的达摩克利斯之剑,大家都默认要做OpenAlmeiz,现在这把剑终于落下,路径也更清楚了。而从某种意义上讲,选择显然比努力更为重要。

来源:壹零社


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1