当前位置:首页|资讯|GPT-4|OpenAI

对标or颠覆?Anthropic让创业者狠狠共情

作者:大模型之家发布时间:2024-03-08

如何看待Claude3?“超越”“震撼”“吊打”已成为它最深入人心的标签……

当地时间3月4日,Anthropic发布Claude 3系列模型,该公司称这是迄今为止速度最快、功能最强大的人工智能模型。Claude 3模型系列包括三个模型,分别是:Claude 3 Haiku、Claude 3 Sonnet、 Claude 3 Opus。

图源:网络

Claude3的发布一时间引得行业内外群情鼎沸,很多人都将其与GPT4进行比较,认为Claude3将是最有可能超越OpenAI在人工智能主导地位的大模型。

对此大模型之家也延伸出了一些思考——为什么Claude3一出场就如此“炸裂”?

GPT-4“最强劲对手”的缔造者同样来自于OpenAI

就像360公司董事长周鸿祎说的“在硅谷,秘密是保不住的,他们有一个非常强大的人际关系网。”Anthropic联合创始人兼首席执行官Dario Amodei,早在2016年便加入了OpenAI。 

图源:网络

作为OpenAI的前副总裁,他本可以与公司一起享受GPT带来的荣耀,但在2021年Amodei选择出走OpenAI并创立了现在的Anthropic。 

据了解,Dario Amodei的出走原因,主要与OpenAI在2021年获得微软的投资后的下一步发展路径这一层面产生了较大分歧。作为一家非营利组织,Dario Amodei认为企业应该坚持自己的愿景和计划,而另一部分高管认为未来企业将在与微软的合资企业方面开展营利业务。 

并且,彼时的OpenAI正面临着安全问题还未解决的困扰,Dario Amodei认为在没有解决大模型安全问题就上线GPT-3将会带来很多问题,并且这也是一种不负责任的表现。事实上直到2023年ChatGPT爆火后,OpenAI现任CEO山姆·阿尔特曼依然会经常出现在有关人工智能安全问题的听证会上。 

虽然安全问题可能会影响决策,但也只是推动此类重大变化的考虑因素之一。 他也认为在产品开发与研究重点方面,自己与OpenAI不再契合,在种种条件的驱使下Dario Amodei选择创办一家公司来追求他对人工智能发展的愿景。Dario Amodei的出走更像是一个战略选择,目的是在一个新的环境中实施他的人工智能开发哲学,这也是为什么他可以带走OpenAI其他具有战略价值成员,包括Tom Brown(GPT-3首席工程师)。 

据可查数据显示,截至2023年7月,Anthropic已经筹集了15亿美元的资金。这包括亚马逊和谷歌的重大投资,亚马逊在2023年9月宣布投资高达40亿美元。

值得一提的是,2023年年底OpenAI深陷离职风波时,OpenAI董事会就潜在的合并事宜与Dario Amodei接洽,并取代阿尔特曼担任首席执行官。只不过Dario Amodei并没有接受OpenAI的报价,这也从侧面说明Dario Amodei有着一个企业家或开发者自己的信仰。

与理想背道而驰,Amodei憋了一股劲

并没有想着对标谁,Claude3就是要走一条不一样的路径。 在调研的过程当中,大模型之家发现Claude3在任务处理的过程中通常会给予使用者更精准、更原创的答案。由于Claude系列模型对外公布的信息较少,所以业界一直有声音表示Claude的训练方式源自Anthropic提出的Constitutional AI概念。 

图源:网络

其核心就是通过RLAIF(Reinforcement Learning from AI Feedback)来对模型进行训练 ,通过使用一个强大的现成的语言模型来生成偏好标签,代替传统依赖人类反馈的方法。这种方法在文本摘要、有益对话生成和无害对话生成等任务上,已经显示出与人类反馈训练相当或更优的性能。 

在解决文本理解和生成中的长期依赖性问题下足功夫。 Claude作为以长文本能力为优势的大模型,Claude3 Opus版本支持了 200K Tokens 的上下文窗口,并且可以处理100万Tokens 的输入。 

对于许多自然语言处理任务来说,例如机器翻译、摘要生成、问答系统等,长期依赖性是一个关键挑战,因为文本的含义通常需要考虑到较远的上下文联系。 

用户通常期望大模型能够理解和生成与其提供的文本相关的广泛信息。 通过训练模型处理更长的上下文,模型将学习到更广泛的语言模式,并且能够更好地适应于不同领域和风格的文本数据。这将增强模型的泛化能力,使其在各种任务和场景下表现更加稳健。 

图源:网络

同时,Anthropic采用了大量复杂的实际问题,以应对当前模型中已知的弱点,并将答案分类为正确答案、错误答案(或虚假答案)以及承认不确定性。 

克劳德启示录,人工智能离边界还远

毫无疑问,Claude 3的成功,也向全世界释放着强烈的信号,OpenAI的地位并不像想象中那样不可撼动。 或许Claude的表现并未像官方数据那样抢眼,但其带来的影响和产品的商业价值都将成为创业者最好“教科书”。 

图源:网络

特别是对于一些中国的初创团队,甚至是拥有雄厚资源的科技大厂,Anthropic团队的成果证实了想在人工智能领域抢占高地靠的不一定是最顶级的资源,更是要有自身清晰的认知和明确的发展路径。

有传言称GPT-5的发布时机,已经不取决于企业本身,更是在迎合目前复杂的国际局势。 无论真实与否,在国际竞争中,人工智能都已经成为新的竞争高地,这也为我国人工智能科研单位、企业带来了更多动力。 

在教育、交通、通信、能源等基建领域、我国人工智能技术发展都在实质性地帮助社会和企业实现降本增效。在两会政府工作报告中对于新质生产力、人工智能+、数字经济、强化企业科技创新主体地位等内容,也引发了在场以及众多科技从业者的共鸣。

小米董事长雷军也表示:“人工智能是现在最热门的科技创新的话题,最近一系列的技术突破,都是美国最先突破的,我觉得中国在追赶阶段,我建议在今天的基础教育里面普及人工智能的知识,加大国内的人工智能人才的供给。”

图源:网络

大模型之家认为加大对人工智能技术研发的投入势在必行。同时,加强与国际合作,并制定更加明晰的政策和法规,以推动人工智能技术的创新与应用。 此外,还需加强人才培养,培养更多的人工智能专业人才,提升国家在人工智能领域的核心竞争力。 

Anthropic等故事虽然无法复刻,但人工智能领域的发展还有着更为广阔的天地。在我国,实现技术自主才能避免在国际竞争中被“卡脖子”的现象,并且基于各行业广袤的数据积累,也为我国人工智能领域带来先天优势。在实现技术自主的过程中,可以借鉴国外的先进经验,同时结合本土实际,积极推动技术自主创新。这不仅可以提高中国在人工智能领域的国际地位,还可以为中国经济的高质量发展提供强有力的支撑。 

本文来自微信公众号“大模型之家”(ID:damoaihome),作者:兴哲,36氪经授权发布。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1