当前位置:首页|资讯|OpenAI|AI大模型|通义千问

OpenAI推出大模型迷你版;大模型高考成绩偏科 | 图灵周报

作者:未来图灵发布时间:2024-11-21

图灵周报:精选AI行业一周大事件,从良莠不齐的行业资讯中挑选出最有价值的信息,配上专业点评,值得你细读、品味。

01

OpenAI发布GPT-4o mini

图源:OpenAI官网

当地时间周四早晨,OpenAI宣布,正式上架价格显著下降的新一代入门级别人工智能“小模型”GPT-4o mini。即日起,ChatGPT 的免费用户、Plus 用户和 Team 用户都能够使用 GPT-4o mini。

点评:GPT-4o mini的API价格将会是15美分/100万Tokens输入,以及60美分/100万Tokens输出。上下文窗口依然是12.8万个Tokens,知识截止日期为2023年10月。公司拒绝透露新模型的参数量大小,仅表示与市面上类似的AI小模型(Claude Haiku、 Gemini 1.5 Flash等)处于同一个级别。作为对比,GPT-4o的百万Tokens输入/输出价格是5美元/15美元,之前的入门款模型GPT-3.5 Turbo定价是0.5美元/1.5美元。所以最新的“迷你模型”要比GPT-4o便宜了96%-97%,比起GPT-3.5 Turbo也要便宜60%-70%。正因如此,随着GPT-4o上架,GPT-3.5 Turbo的历史使命到此结束。

02

谷歌和OpenAI等14家公司成立安全AI联盟

图源:CoSAI官网

7月18日在阿斯彭安全论坛上,全球科技巨头谷歌携手微软、亚马逊、英特尔、英伟达、IBM、思科、Paypal、OpenAI、Anthropic、Cohere、Chainguard、WIZ及GenLab等共计14家领先企业,正式宣布成立了安全人工智能联盟(CoSAI)。CoSAI聚焦于三大核心目标:一是深入挖掘并推广人工智能安全的最佳实践,为行业树立标杆;二是积极应对人工智能领域不断涌现的新挑战,确保技术发展的稳健前行;三是全面保障人工智能应用的安全性,为用户和社会带来福祉。

点评:该联盟由备受尊崇的OASIS全球标准机构鼎力支持并主办,作为一项前瞻性的开源计划,CoSAI旨在构建一个面向全体AI从业者及开发者的资源共享平台,通过提供详尽的指导手册与高效工具,助力他们设计出更加安全可靠的人工智能系统。这一举措不仅促进了行业内知识与技术的交流共享,还为构建安全的AI生态系统奠定了坚实的基础。

03

Meta不会在欧盟提供新的多模态AI模型

图源:unsplash

Meta在一份声明中表示,他们将在未来几个月发布一款多模态的Llama模型,但由于欧洲监管环境的不可预测性,它不会在欧盟发布。就在上月,苹果同样表示,出于监管方面的考虑,它不会在欧洲发布Apple Intelligence功能。

点评Meta计划在包括智能手机和Meta Ray-Ban智能眼镜在内的多种产品中采用新的多模态模型,这些模型可以在视频、音频、图像和文本之间进行推理。Meta表示,这一决定意味着欧洲公司将无法使用多模态模型,尽管这些模型是以开放许可的形式发布的。此举为Meta与欧盟监管机构之间的摊牌埋下了伏笔,也凸显出美国科技巨头越来越多选择拒绝向欧洲客户提供产品。

04

大模型高考成绩:文科可上一本,理科过二本线

图源:评测结果

继公布AI高考语数外成绩后,大模型开源开放评测体系司南(OpenCompass)近日对7个AI大模型进行了高考全科目测试,结果显示:书生·浦语2.0系列文曲星大模型(浦语文曲星)、阿里通义千问大模型Qwen2-72B以及GPT-4o再次包揽文、理科前三甲;前三名AI“考生”的文、理科成绩分别超过了“一本”“二本”线(以今年高考人数最多的河南省的分数线为参考)。

点评:在评测中,AI在文科科目如语文、历史、地理、思想政治等科目上展现了深厚的知识储备和理解能力,但在理科科目中,数理推理能力普遍存在短板。特别是在面对带图题目时,得分率仅有37.64%,显示出在图片理解和运用能力方面,所有大模型均存在较大提升空间。阅卷老师指出,尽管大模型在基础知识掌握上表现出色,但在逻辑推理和知识灵活应用方面仍有较大差距。例如在作答主观题时,大模型常常无法完整理解题干,导致答非所问;在解答数学题时,解题过程机械且逻辑性差。

05

快手可灵总申请使用人数已超百万

图源可灵官网

7月19日消息,快手数据显示,快手可灵AI自6月6日开放申请以来,总申请使用人数已超百万人,其中超30万人已获得试用资格。在日前落幕的WAIC2024上,快手还正式发布了可灵AI的Web端和多项新功能,并将文生视频时长开放到10秒。

点评:可灵大模型为快手AI团队自研,采用与Sora相似的技术路线,并结合多项自研技术,能够生成大幅度的合理运动、能够模拟物理世界特性、具备强大的概念组合能力和想象力,效果对标Sora。其生成的视频分辨率达1080p,时长最高可达2分钟(帧率30fps),且支持自由的宽高比。目前,用户可在快手旗下的快影App申请使用可灵大模型进行文生视频的创作。

06

华为起诉联发科专利侵权

图源:Pixabay

7月19日,据企业专利观察报道,华为近日已经向地方法院对联发科发起了专利侵权诉讼。据国内知识产权行业专家推测,此次华为起诉联发科的专利,很有可能涉及5G(或含4G、3G等)等蜂窝移动通信技术。联发科对此表示,对公司影响不大,案件已进入司法程序,不予评论。华为方面则暂无回应。据界面新闻了解,双方的分歧点在于专利许可费的价格并未谈妥。

点评:专利侵权案件在手机行业时有发生。不过,此次华为起诉联发科专利侵权,是行业中少见的手机厂商起诉芯片厂商的案例。一般情况下,类似诉讼都系芯片厂商起诉手机厂商侵权,要求收取专利许可费,或是手机厂商之间相互起诉。例如美国芯片巨头高通就在印度等多地向中国手机公司传音发起诉讼,称后者侵犯其四项“非标准必要专利”。而华为发起的这项诉讼,这可能是行业既有专利许可模式下的一次全新尝试。有观点认为,这是专利许可层级从“终端级”向“组件级的转变。

07

图灵指数:AI榜、大模型榜、金融榜、机器人榜

戳我查看本月“AI企业榜单”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1