GPT-4变笨实锤了? 斯坦福、UC伯克利最新研究称,和3月相比,GPT-4在6月的性能直接暴降。 甚至,代码生成、问题回答大不如前。 论文地址:https://arxiv.org/pdf/2307...【查看原文】
DoNews7月21日消息,这段时间有不少用户发现GPT-4变笨了,并晒出了不少证据。据悉,评估的对象包括GPT-3.5和GPT-4两个大模型,并在四个任务上进行测试:数学问题、回答敏感/危险问题、代码生成以及视觉推理。
斯坦福GPT-4OpenAI编程
DoNews 2023-07-21
GPT-4变笨,实锤了???来自斯坦福大学和UC伯克利大学的一篇最新论文显示:6月的GPT-4在一些任务上的表现客观上就是比3月的更差。比如他们用同样500道「判断给定整数是否为质数」的问题来
GPT-4斯坦福OpenAI
2023-07-20
当前大热的MBTI人格测试可以看做是“荣格八维”系统的简化版,其本质概念皆起源于荣格的著作《心理类型》。北京时间7月24日,推特正式变为“X”——除了其原名Twitte和某些应用商店的图标之外,平台内部首页的标志、UI配色,以及各路口径里,都已不见“小蓝鸟”的踪影。对此,许多推特用户怒斥马斯克亲手毁掉了推特的品牌价值。
斯坦福GPT-4马斯克
南方都市报 2023-07-26
前些天,有不少用户抱怨GPT-4变笨了,但到底变得有多笨呢?近日,来自斯坦福、UCBerkeley的一篇arXiv预印本论文给出了对这一问题的定量实验结果并公布了相关评估和响应数据。
GPT-4编程斯坦福
机器之心Pro 2023-07-20
OpenAI承认了科学实验下的证据。
斯坦福GPT-4OpenAI
大数据文摘 2023-07-21
9月19日9时14分,我国在西昌卫星发射中心用长征三号乙运载火箭与远征一号上面级,成功发射第59、60颗北斗导航卫星。这组卫星属中圆地球轨道(MEO)卫星,是我国北斗三号全球卫星导航系统建成开通后发射的第二组中圆地球轨道(MEO)卫星,入轨并完成在轨测试后,将接入北斗卫星导航系统。
极目新闻 12小时前
9月19日12:11,随着满载乘客的CZ3539航班从广州白云国际机场腾空而起,中国南方航空(以下简称“南航”)编号为B-919J的首架C919飞机正式迈入商业运营新阶段。
光明网 10小时前
钛媒体App9月19日消息,可灵AI面向全球发布重磅升级,视频生成新增可灵1.5模型,在画面质量、动态质量、文本响应度等方面均有大幅提升。同时,可灵AI还引入了全新的“运动笔刷”功能,进一步提升视频生成的精准控制能力,效果业内领先。
钛媒体快报 12小时前
高溢价收购一地鸡毛:标的业绩“变脸”,华仁药业反被索赔2.84亿
钛媒体APP 10小时前
IT之家9月19日消息,普渡机器人今日发布初代类人形机器人PUDUD7,基于仿生双臂和全向移动底盘设计,能够在多个场景中执行复杂任务操作。IT之家注意到,PUDUD7预计将在2025年实现商业化落地。该机器人身高165厘米,重量45公斤,仿生臂的单臂展达到65厘米,整机拥有30个自由度,配备灵巧手后,自由度将提升至50。
IT之家 9小时前
加拿大滑铁卢大学日前发布的新闻公报说,该校研发人员研发的新装置完全靠太阳能驱动,并可自我清洁,每平方米每天能制取约20升淡水。该装置的核心部件是泡沫镍,即含有大量泡沫气孔的金属镍,其表面积非常大,透气性高,而且很轻。
北京日报 12小时前
在2024年华为全联接大会上,华为副董事长、轮值董事长徐直军发表了题为“全面智能化时代的挑战与机遇”的主题演讲,分享了华为在人工智能(AI)领域的观察、思考、战略和实践。他指出,AI已成为推动各行各业智能化的关键技术,其商业应用主要集中在产品开发、营销和业务运营等环节。
金融界 10小时前
出游旺季,一架无人机穿越山林海岸,开展自动巡查、智能扫描,通过语音喊话引导游客注意安全。“以前在公园点外卖可不容易,定位难、走得远。空中“科技之眼”配合AI识别自动监测,园内焚烧野炊、违规盗挖等行为无处遁形,遇到游客爬树、私搭帐篷等行为,还能及时远程喊话提醒。
金台资讯 13小时前
由企业网D1net、信众智(CIO智力输出及社交平台)和中国企业数字化联盟共同主办的“制造业标杆两会”——“2024全国汽车业数智化大会”和“2024全国制造业数智化大会”于9月13日至14日在杭州圆满落幕。
砍柴网 11小时前
具身智能将会是多模态大模型的killer APP。
邱晓芬 6小时前
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1