9.11和9.9哪个大,看AI大模型算错,我就放心了!#ai人工智能 #9.11和9.9哪个大12个模型8个错 #夜航评论 @楚希【查看原文】
没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新
AI大模型谷歌
2024-07-16
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。目前全球公认第一梯队的大模型ChatGPT,在被问到“9.11和9.9哪个大”时回复称,小数点后面的数字“11大于9”,因此9.11大。
AI大模型ChatGPT商汤
红星新闻 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
光明网 2024-07-17
不论是想把旅行中的美好瞬间剪辑成一个短片,还是想把一场精彩的活动记录下来,学会拼接视频绝对是个值得掌握的技能。
新报观察 2024-12-31
业界传出,台积电已于竹科宝山厂试产2纳米制程约5000片,相关进展顺利,可望如期量产,后续高雄厂也将跟进量产2纳米。台积电此前在法说会上提到,2纳米制程技术研发进展顺利,装置性能和良率皆按照计划甚或优于预期。2纳米将如期在2025年进入量产,其量产曲线预计与3纳米相似。
金融界 2024-12-31
IT之家12月31日消息,MetaQuest系列头显因系统软件更新,出现大规模“变砖”故障,引发用户强烈不满。Meta最初拒绝为保修期外的Quest2/3/3S用户提供解决方案,后迫于舆论压力,改口称正在积极修复问题。
IT之家 2024-12-31
谷歌首席执行官桑达尔·皮查伊称,2025年对公司来说将是“关键的一年”,因为该公司在追赶人工智能的快速发展的同时,还面临着越来越多的竞争和监管障碍。据媒体报道,皮查伊和其他谷歌高管在该公司的2025年战略会议上列出了明年的优先事项。到2025年,我们需要坚持不懈地专注于释放这项技术(人工智能)的好处,并解决实际的用户问题。”
在日常使用苹果设备的时候,有时候我们会希望把某个应用程序或者窗口调到全屏状态,这样不仅能更好地集中注意力,还能享受更广阔的视野。对于不同的苹果设备,全屏操作的方法可能会有所不同,今天就来聊聊如何让你的苹果设备实现全屏显示。先说说Mac电脑。其实,使用Mac的全屏功能非常简单。
摩根士丹利在最近的一份研究报告中表示,个体化癌症疫苗和抗体药物偶联物(antibody-drugconjugate,ADC)将成为明年主要的癌症治疗生物技术创新之一,包括Moderna(MRNA.US)、默沙东和阿斯利康在内的公司预计将公布关键试验数据。
IT之家12月31日消息,彭博社记者马克・古尔曼(MarkGurman)今天(12月31日)在X平台发布推文,表示虽然目前没有听到相关的曝料线索,但认为苹果为妙控鼠标加入AI语音控制功能“合情合理”,引发了对苹果下一代鼠标的热议。
IT之家12月31日消息,三星旗下一款GalaxyWatch8Classic智能手表已现身GSMA数据库,型号为“SM-L505U”,支持蜂窝数据连接,这暗示着三星将从明年(2025年)开始再次为旗下GalaxyWatch智能手表推出Classic型号变体。
耳机主要分为两种,一种是插头式的,也就是我们常见的3.5mm插头耳机;另一种是蓝牙耳机。在插耳机之前,建议先观察一下耳机的插头。
IT之家12月31日消息,消息显示,三星即将推出的GalaxyS25系列或将配备车祸检测功能。早在OneUI5.1.1版本中,就已存在一个名为“MoccaMobile”的隐藏系统应用,其中包含启动和停止车祸传感器的代码。
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1