当前位置:首页|资讯|编程|ChatGPT

砸自己饭碗?最强AI程序员Genie,84秒跑通代码,吊打人类码农

作者:搜狐科技发布时间:2024-08-15

出品 | 搜狐科技

作者 | 李阳

大模型在“替代人类程序员”的路上越走越远。

距离上一次人工智能软件工程师Devin引爆AI社区仅半年之久,AI编码的头号交椅又易主了。

一位号称“全球性能最好”的AI程序员「Genie」横空出世。

这一次,它已经强大到可以像人一样思考和行动了。

我们先来看一下他在第三方测试的表现:

在权威榜单SWE—Bench中,Genie以解决了30.08%问题的成绩轻松超越了Devin(13.80%)。

新工具的表现甚至超过了亚马逊的Q和Factory的 Code Dorid 。

Genie与其他 AI 代码模型的比较

抛开在基准测试分数上的优势不谈,Genie更强大的是它从开始就在以模仿人类工程师的思维和行动为目标在进行训练。

这也就意味着,这位AI程序员不仅修得了Bug,写得了代码,同时在速度上远超人类!

就此,“AI砸饭碗”、“码农失业”等话题再度被热议。

创造出了AI大模型的程序员,真的会率先成为被冲击,甚至是被取代的工作吗?

文能写代码,武能修Bug,速度吊打人类码农

自ChatGPT问世 以来,有关“AI能否取代程序员”的言论越来越多。

英伟达CEO黄仁勋,百度的李彦宏等科技大佬都曾在公开场合表示过,以后或将大幅度减少甚至不再需要程序员这个职业,其职业能力将被AI替代

曾经,很多人觉得这些说法有些危言耸听,因为他们坚信编程不只是写代码那么简单,更重要的是解决问题和创新。而当时的AI大模型原理依然只是归纳,而非逻辑推理。

可随着Genie的出现,这种所谓“顶尖程序员才具备的创造力和创新思维”的自信已然被打破。

抛开在基准测试分数上的优势不谈,Genie更强大的是它从开始就在以模仿人类工程师的思维和行动为目标在进行训练

这也就意味着,这位AI程序员不仅可以按照指示自主处理各种编码任务,包括Bug修复、功能构建、代码重构、代码测试等。同时,还具备了逻辑思考的能力。

用团队的话来说,Genie完全可以做到像人类工程师一样解决现实生活中的软件问题

以解决GitHub Issue为例,先喂给Genie一个repo的链接,它就会开始自动解析问题:

Genie会自动迭代思考如果想要解决这个问题都需要哪些文件,直到它觉得找到了自己满意的为止:

然后,它会对问题做一个自动迭代分析的过程,接着就开始唰唰唰地自动跑代码了。一旦过程中出现了Bug,它还会针对出问题的地方再重复分析,将上述过程再重复一遍,直到跑通为止。

整个过程,仅需要84秒钟!

据介绍,在此之前,Genie已经观察并学习人类程序员如何解决软件问题的次数达到了数百万次。

如今他俨然成为一位能够自主思考的全能型“同事”。

只不过,比普通的人类码农效率更高。

专有模型和上下文支持,沾了OpenAI的光

Genie能力提升的另一大关键,在于OpenAI提供的大模型支持。

与许多依赖基础模型并辅以少量工具的AI模型不同,Genie是通过专有流程开发出来的。

其中包括训练和微调来自OpenAI的模型。

当研究者开始构建Gennie之处,他们只能在16-32范围内微调相对较小的上下文窗口模型。

Cosine 在其博客文章中表示,他们花了将近一年的时间来整理数据集,在最近的训练运行中,Genie 接受了数十亿个 token 数据的训练,选择的数据包含了用户目前最关心的编程语言。

幸运的是,不久之后,能够确保训练长上下文的 OpenAI 模型出现了。这也成为了Genie能力的突破口。

目前,Genie已经进入内测阶段,其定价也将分为两个等级:

  • 入门级选项,定价大约在 20 美元左右。这个层级会有一些功能和使用限制,适合个人和小型团队使用;
  • 企业级选项,提供扩展功能,使用几乎不受限制,好比拥有了一个精通代码的 AI 同事。但这个层级的定价将更高。

Genie的目标是改变工程资源分配,而非取代人类程序员

Pullen 表示,对于他来说,工程资源不再成为限制是一个巨大的推动力,特别是在创办公司以来。

他认为,一个能够快速进入未知代码库并解决未见过的问题的 AI “同事”,其价值显而易见,并且对世界有着巨大的影响。

在他看来,Genie的推出对于软件开发团队是利大于弊的

尤其是那些希望提高生产力,并减少花在日常任务上的时间的团队。

有了Genie这样可以自主处理复杂编程挑战能力的“同事”,团队能够有更多精力、财力去投入到更具有战略性的计划当中。

这也就意味着,Genie更像是对人类程序员的效率放大工具。公众所设想的AI全面自动化的情景,短时间内无法到来。

尽管如此,AI软件工程师技术的飞速迭代,势必加速软件工程人才市场的新旧淘汰。

一部分率先应用AI的高级人才效率被提高,同时,加速了另一部分人才的落伍和被淘汰。这不得不让很多工程师们捏了把汗。

而对于整个生产体系而言,如何进一步在教育、人才培养、发展中全面重视和提升人才的创造性和不可替代性,才是重点课题。

而需要面对这个问题的,绝不仅仅是“码农”,而是我们每一个人。

///

五个人的创始团队,成功打造了一个“地表最强”。

目前,Cosine 已经成功筹集到了 250 万美元的种子资金。规模虽小,但 Cosine 已经在 AI 领域取得了重大进展,而 Genie 只是一个开始。

这也意味着AI对人类的挑战才刚刚开始。

值得关注的是,Genie目前是可以申请Waitlist了,链接如下:

Waitlist地址:https://cosine.sh/register


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1