IT之家8月15日消息,OpenAI公司于8月13日发布新闻稿,宣布推出SWE-benchVerif...【查看原文】
该基准是对现有SWE-bench的改进版本(子集),旨在更可靠地评估AI模型解决现实世界软件问题的能力。虽然LLM在SWE-bench上取得了令人瞩目的进展,但OpenAI的研究发现,该基准存在一些问题,可能导致低估模型的自主软件工程能力。
OpenAI
华尔街见闻 2024-08-14
一直以来,大模型的编程能力都备受关注,超强AI程序员Devin的问世更是将「AI能否替代程序员」这一话题推上了风口浪尖。最近,Devin也迎来了新对手——初创公司Cosine推出的自主AI程序员Genie。这个SWE-Bench是一个用于评估LLM解决GitHub上真实软件问题能力的基准测试数据集。
OpenAI编程GitHub
机器之心Pro 2024-08-14
OpenAI公司于8月13日发布新闻稿,宣布推出SWE-benchVerified代码生成评估基准,解决了此前的局限性问题,能够更准确地评估人工智能模型在软件工程任务中的表现。SWE-bench是一个软件工程…
OpenAI编程人工智能
三言财经 2024-08-16
该基准是对现有SWE-bench的改进版本(子集),旨在更可靠地评估AI模型解决现实世界软件问题的能力。》报告了一项基于稀土钡铜氧化物(REBCO)的超高性能超导线材的制备成果,为世界上性能最高的高温超导线段,同时性价比指标显著提高。
OpenAI谷歌
每日经济新闻 2024-08-14
豆包MarsCode 积极探索缺陷自动修复,通过对多 Agent 协作和静态分析的创新和结合,在 SWE-bench Lite 排行榜上位列第一,一文了解技术细节
豆包MarsCode 2024-10-25
金融界2024年12月26日消息,国家知识产权局信息显示,维特瑞交通科技有限公司取得一项名为“一种交管机器人的运行防倾倒判别机构”的专利,授权公告号CN222200570U,申请日期为2024年9月。
金融界 2024-12-26
金融界2024年12月26日消息,国家知识产权局信息显示,瑞安市鹏达冲压件有限公司取得一项名为“一种弹簧盘自动化装夹设备”的专利,授权公告号CN222200557U,申请日期为2023年12月。
金融界2024年12月26日消息,国家知识产权局信息显示,华能荆门热电有限责任公司申请一项名为“种调节阀线性纠偏方法及系统”的专利,公开号CN119179266A,申请日期为2024年8月。
金融界2024年12月26日消息,国家知识产权局信息显示,库卡机器人(广东)有限公司取得一项名为“机器人控制系统以及机器人”的专利,授权公告号CN222200569U,申请日期为2024年5月。专利摘要显示,本实用新型提供了一种机器人控制系统以及机器人。
金融界2024年12月26日消息,国家知识产权局信息显示,通用电气公司申请一项名为“用于模型校准的方法和系统”的专利,公开号CN119179265A,申请日期为2024年6月。在一些实施例中,该方法包括经由控制电路从操作测试接收真实世界系统(诸如发动机)的操作参数的测试数据。
金融界2024年12月26日消息,国家知识产权局信息显示,华涧新能源科技(上海)有限公司申请一项名为“一种VGT位置参数自学习方法”的专利,公开号CN119179270A,申请日期为2024年10月。
金融界2024年12月26日消息,国家知识产权局信息显示,建型(山东)建材科技有限公司取得一项名为“一种石膏砌块自动夹取机械手”的专利,授权公告号CN222200559U,申请日期为2024年1月。
金融界2024年12月26日消息,国家知识产权局信息显示,海能机械科技(辽宁)有限公司取得一项名为“一种用于大型热室放射性废物处理的热室动力机械手”的专利,授权公告号CN222200562U,申请日期为2024年5月。
金融界2024年12月26日消息,国家知识产权局信息显示,重庆华睿新高科技有限公司取得一项名为“一种辅助臂膀”的专利,授权公告号CN222200566U,申请日期为2024年5月。
金融界2024年12月26日消息,国家知识产权局信息显示,南京康尼电子科技有限公司和南京康尼机电股份有限公司申请一项名为“一种用于站台门系统控制的辅助备份系统AUXbk”的专利,公开号CN119179281A,申请日期为2024年7月。
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1