当前位置:首页|资讯|OpenAI|ChatGPT

凌晨两点的OpenAI DevDay,一周年的ChatGPT,超级智能应用的野心

作者:未尽研究发布时间:2023-11-06

凌晨两点的OpenAI DevDay,一周年的ChatGPT,超级智能应用的野心

OpenAI的首次开发者大会,OpenAI DevDay,将于北京时间11月7日(明天)凌晨举办。

ChatGPT推出即将一周年,而在过去的一年,生成式人工智能,成为最热门的话题之一,也成为企业最关心的变量之一。

年底了,大家都在冲刺业绩,发布大模型也不例外。年初吹过的牛,年内也必须兑现了。基础大模型这张船票,年内必须抓在手里。

这样的势点,也必须得蹭呵。

ChatGPT的超级智能应用野心

既然GPT-4加持了微软所有的copilot应用,而且越来越多的AI新物种都在围绕GPT-4形成生态,GPT成为新的操作系统,似乎也可以当仁不让。

GPT基础模型的能力正在向下游倾泻,ChatGPT在推出一年之后,正在变成一个超级智能应用。

这次ChatGPT开发者大会,陆续有五花八门的剧透传出。归纳如下:

上传文件的能力。如PDF、数据文档等,在ChatGPT上能处理更加复杂的工作。上周一已经解禁,而其竞争对手Anthropic的Claude模型等,早已经开放这些能力。

无需转换即可使用所有工具。OpenAI开发者论坛上,已经有网友发现GPT-4(ALL Tools)开始灰度测试了。ChatGPT界面也出现了不同的变化。GPT-4 (All Tools)打通各个模式之后,是一个非常好用的助手,可以识别和讲解幻灯,还能立即写出程序代码。

处理更长的上下文窗口。GPT-4(ALL Tools)配上了32k上下文窗口。如果单独使用DALL·E 3、浏览器等工具,仅有8k的上下文窗口。

链接外部任务。如Google Drive和Microsoft 365,使文件、表格或演示文稿能够附加到聊天中或用作对话的上下文。

服务企业市场。为企业提供无限制快速GPT-4访问、更长上下文和高级数据分析模型等服务。还为个人和团队的工作空间提供了分隔,并允许定义角色、部门或其他元数据,预计还可以整合外部ERP和CRM系统。ChatGPT可能成为一个超级企业服务应用。

OpenAI的科学家Karpathy认为GPT将成为新操作系统,这一愿景更近了一步。在这样的生态基础上,如果市场和收入分享模式真正起飞,智能代理工具开发(Agent Devs),就像当年的iOS应用开发一样,将成为一个新的职业。

形势逼人强。ChatGPT的增长,已经遇到了瓶颈,而且这一轮的生成式AI应用,虽然以最快的速度突破了上亿的用户,但从那以后,增长放缓,而普遍遇到了留存率不高的问题。

在所有生成式AI应用中,活跃度最高的,并不是ChatGPT,而是个人化定制的应用Character AI。据OpenAI开发者大会剧透出来的内容,它将让用户可以为自己定制对话机器人。如下面这个界面:

马斯克推出Grok聊天机器人

11个人玩命干了两个月,马斯克的x.AI干出来了一个对话机器人Grok。

首先是马斯克昨日发布的与ChatGPT抗衡的Grok,这个330亿参数(原型Grok-0)的大模型,目前可以在社交媒体平台X(前推特)上的部分付费定阅用户内部使用,之后将每月16美元。这个机器人的训练,主要使用了推特上的语料。

行家评论,这个模型的能力,在GPT-3.5到GPT-4之间。其优势主要是体现在对话功能。相对于其他通用预训练Transformer模型,它最大的优势,是包括最新的信息,主要是X平台上的最新信息。

如马斯克自己发了一个测试,问他在最近接受美国知名自媒体人Joe Rogan的采访时,Joe的穿戴是什么。Grok直接就说出了事实,而另外一个对话机器人,啰嗦了一堆背景材料。

Grok能与X平台上的信息保持实时同步,但Perplexity 和 Bard 也都能够检索最新信息。Grok的优势在于获取 X 上实时内容的独特能力。这种能力建立在X独有的全球新闻的汇聚地,而且通常比传统媒体更快地获取信息。

但X上虚假信息很多,Grok的推出,可能会加剧虚假信息的传播。如以哈战争爆发初期,X上散布了大量的虚假信息,马斯克本人还收到了欧盟的公开警告信

Grok 面临的问题,也是新闻媒体在生成式人工智能时代面临的前所未有的挑战:如何通过不同角度、甚至完全相反的证据进行推理;如何将事实与观点分开;如何对敏感话题保持慎重,而不是添油加醋,放大言论的极端性,等等。

从这一点来说,Grok拥有强大的社交媒体资源,尤其是汇集了世界上最丰富及时的新闻、观点和知识,Grok在传播与内容生成应用中的探索,具有重大意义。也正如英伟达高级科学家Jim Fan所说:“解决上述问题将成为LLM研究中的一个重大成就,对应用产生深远的影响。”

Grok另一个独特之外,似乎在于其语言风格。当初测试GPT-4的时候,人们在担心幻觉的同时,也注意到幻觉上所流露出来的创意和想象力。

人类交流的大量内容,并不直接涉及到真伪和对错,而是大量的情绪表达、想象表达,这些感性的内容,如何通过人工智能的对话展现出来,甚至产生一些个性化的表达,都是未来生成式AI应用的发展空间。人类在对大模型进行对齐时,可以进一步与人类的感性、个性对齐。

关于大模型训练中情感与个性,对于大模型的推理能力的影响,有一些研究。最近北京师范大学的一项研究表明,适当加强情感提示,能让大模型产生情感智能,增加一定的推理能力。而人格化训练大模型的研究表明,通过分配给大模型某种类型的人格,会增加生成内容的“毒性”,即不适当的语言。

Grok主要是用X上的语料训练的,所以它的语言风格也会带有社交语言的特征,而一般通用大型语言模型与人类的正规书面语言更加对齐。

正如Jim Fan所评论的:我对拥有人性化特质的聊天机器人感到非常兴奋:幽默、辛辣观点、引人入胜的辩论。其他大型人工智能公司积极压制这些特质。最有趣的结果往往是最有可能的!

李开复发布Yi开源大模型

李开复年初创办的零一万物,上百人有条不紊地干了8个月,今天,终于推出了Yi源大模型系列。

在其公司网站上的动画显示,Y是一个倒写的人字,意思是AI要以人为本。

李开复称这是荟萃了他40多年AI职业生涯之作。目前发布了Yi-34B和Yi-6B两个模型,都达到了超长上下文200k,中英文为主的语言语料3万亿。目前开发者可申请免费商用。

Yi-34B 预训练模型号称在多项评测中全球领跑,MMLU等评测取得了多项 SOTA 国际最佳性能指标表现。能以更小模型尺寸评测超越 LLaMA2-70B、Falcon-180B 等大尺寸开源模型,对开发者社群更为友好。Yi-6B 适合个人及研究用途,目前Yi-6B,Yi-34B 开源模型对学术研究完全开放,同步开放免费商用申请。

在接受海外媒体采访时,李开复称,零一万物花了不少时间铸牢基础设施,已经拥有了数千卡GPU。当初甚至一度花光了企业的钱,从他担任CEO的创新工场借钱。如今零一万物估值已经超过10亿美元。

李开复表示,零一智能正在训练千亿参数以上的自有大模型,对标GPT-4。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1