GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC

作者：新智元发布时间：2023-11-07

GPT-4 北大

【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白，研究人员引入了PowerPoint任务完成（PPTC）基准测试，以评估LLM创建和编辑PPT文档的能力。最...【查看原文】

相关资讯

GPT-4完成正确率仅6%，北大等提出首个“多轮、多模态”PPT任务完成基准PPTC

多轮，多模态环境

GPT-4 北大

新智元 2023-11-08

GPT-4远不如人类？正确率仅15％，Meta领衔发布通用AI助手基准

GPT-4远不如人类？正确率仅15％，Meta领衔发布通用AI助手基准当前，大型语言模型（LLMs）或许是通用人工智能（AGI）得以实现的“最优解”。然而，尽管大模型在流利性和知识广度方面

GPT-4 大语言模型人工智能 AGI

学术头条 2023-11-24

GPT-4远不如人类？正确率仅15％，Meta、抱抱脸领衔发布通用AI助手基准GAIA

传统评测基准已经失效。

GPT-4

学术头条 2023-11-24

MiniGPT-4升级到MiniGPT-v2了，不用GPT-4照样完成多模态任务

机器之心专栏机器之心编辑部MiniGPT-v2将大语言模型作为视觉语言多任务学习的统一接口。几个月前，来自KAUST（沙特阿卜杜拉国王科技大学）的几位研究者提出了一个名为MiniGPT-4的项目，它能提供类似GPT-4的图像理解与对话能力。MiniGPT-4给出的回答是这张图片在现实世界中并不常见，并给出了原因。

MiniGPT GPT-4 大语言模型

机器之心Pro 2023-10-17

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构建多模态基准

浙江大学等提出多模态视觉推理基准。

GPT-4

新智元 2024-08-08

近期资讯

JLPT日语考级必备《TRY！日本語能力試験N1-N5（日文原版）》PDF分享

‌该套教材涵盖了从N1到N5五个级别的日语能力考试内容，形成了一套完整的日语学习体系‌。每个级别都有对应的语法书籍，如《TRY!新日语能力考试N1语法》、《TRY!新日语能力考试N2语法》等，便于学习者针对自己的水平进行有针对性的学习‌。教材源自日本原版，语法和课文解释地道、准确，有助于培养日式思维‌。每一课都有一篇文章，语法在句子中学习，使得学习者更容易理解和记忆‌。教材中不仅有语法点的详细讲解，还有丰富的例句，建议学习者每学习一个语法点就背诵一个标准例句，以加深记忆‌。网盘地址：zzpnet.top/

散烟先生 2024-12-25

《阴阳学及其阴阳五行的框架研究认识》［节点版，五］

《阴阳学及其阴阳五行的框架研究认识》［节点版，五］ [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片]

林盛治 2024-12-26

2024资产管理系统哪家强？

2024年快要结束，这一年来，在RFID资产管理这个行业有不少实力很强的公司，比较起来各有各的优势，接下来我为大家详细介绍一下：1、首码RFID资产管理系统支持私有化部署和SaaS 模式，提供 RFID 和二维码的固定资产管理方案，为每件固定资产赋予条码标签，实现资产的全方位信息化管理。支持资产的全生命周期管理，从采购、入库、领用、转移、维修、盘点到报废等各个环节均有详尽记录。提供多维度的报表分析，帮助企业更好地了解资产的使用情况。还可根据企业需求提供定制化服务，能满足不同的行业和资产管理场景，操作简便

条码刘帮主 2024-12-25

聊天机器人陷阱：人工智能需要新的UI

我们正处在从通用聊天界面向AI原生体验转型的关键节点

神译局 2024-12-26

诺联科技 2024-12-25

日本人决定自己拯救日产车

“外来和尚”不能念日本经

最话FunTalk 2024-12-26

保质期半年的“预制饭”，加了多少防腐剂？

痛批预制菜的年轻人，拥抱了预制饭

果壳 2024-12-26

GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC

推荐体验

相关资讯

GPT-4完成正确率仅6%，北大等提出首个“多轮、多模态”PPT任务完成基准PPTC

GPT-4远不如人类？正确率仅15％，Meta领衔发布通用AI助手基准

GPT-4远不如人类？正确率仅15％，Meta、抱抱脸领衔发布通用AI助手基准GAIA

MiniGPT-4升级到MiniGPT-v2了，不用GPT-4照样完成多模态任务

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构建多模态基准

近期资讯

JLPT日语考级必备《TRY！日本語能力試験N1-N5（日文原版）》PDF分享

《阴阳学及其阴阳五行的框架研究认识》［节点版，五］

2024资产管理系统哪家强？

聊天机器人陷阱：人工智能需要新的UI

《大学物理》郝玉英第六版第十章（导体和电介质中的静电场）自测题解析

独家揭秘：测力传感器在医疗患者托举力测试中的应用

腾势易三方荣获“中国心”2024年度十佳新能源汽车动力系统

实景特效效果图—江苏省南京市油坊桥互通枢纽（含：传统效果图、实际卫星图片对比）

日本人决定自己拯救日产车

保质期半年的“预制饭”，加了多少防腐剂？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响