当前位置：首页|资讯|苹果|大语言模型|ChatGPT

苹果介绍 Ferret-UI 多模态大语言模型：更充分理解手机屏幕内容

作者：IT之家发布时间：2024-04-10

苹果大语言模型 ChatGPT

IT之家 4 月 10 日消息，苹果公司近日发布研究论文，展示了 Ferret-UI AI 系统，可以理解应用程序屏幕上的内容。

以 ChatGPT 为代表的 AI 大语言模型（LLMs），其训练材料通常是文本内容。为了能够让 AI 模型能够理解图像、视频和音频等非文本内容，多模态大语言模型（MLLMs）因此孕育而生。

只是现阶段 MLLMs 还无法有效理解移动应用程序，这主要有以下几个原因：

1. 手机屏幕的宽高比，和大多数训练图像使用的屏幕宽高比不同。

2. MLLMs 需要识别出图标和按钮，但它们相对来说都比较小。

因此苹果构想了名为 Ferret-UI 的 MLLM 系统解决了这些问题：

与自然图像相比，用户界面屏幕的长宽比通常更长，包含的关注对象（如图标、文本）也更小，因此我们在 Ferret 的基础上加入了 "任意分辨率"，以放大细节并利用增强的视觉功能。

我们精心收集了大量初级用户界面任务的训练样本，如图标识别、查找文本和小部件列表。这些样本的格式都是按照带有区域注释的指令来设计的，以便于精确引用和接地。

为了增强模型的推理能力，我们进一步编制了高级任务数据集，包括详细描述、感知 / 交互对话和功能推理。

苹果在论文中表示相比较现有的 GPT-4V，以及其它 MLLMs 模型，Ferret-UI AI 模型更为优秀。

IT之家附上参考地址

推荐体验

相关资讯

苹果发布多模态模型 Ferret-UI，部分手机 UI 任务超越 GPT-4V

大模型的诞生，让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发，OpenAI、Anthropic、Mistral等创业之星的升起更是证明了在新技术的影响下，大厂并不存在绝对的优势。

雷峰网leiphone 2024-04-10

2023年AI大模型DocLLM多模态文档理解大语言模型(附下载)

今天分享的是：2023年AI大模型DocLLM多模态文档理解大语言模型（报告出品方：浙商证券）近日JPMorgan AI团队Dongsheng W.et al研发了DocLLM。该模型特别强调空间结

AI大模型大语言模型

最爱蜡笔小新 2024-03-11

小米汽车技术发布会官宣；苹果发布开源多模态大语言模型Ferret；Windows 10停服时间确定｜极客头条

OpenAICEOSamAltman在X平台账号上发文征求网友们2024年对OpenAI的愿望与期待：「你希望OpenAI明年新增或修复哪些功能？报告称苹果公司的目标，是和这些主要出版商达成多年合作协议，目前…

汽车苹果 OpenAI 大语言模型

CSDN 2024-01-04

科学家用大语言模型增强视觉-语言理解，验证GPT-4多模态生成能力的背后原因

三月中旬，OpenAI 正式发布了 GPT-4，并向我们展示了其所具备的非凡的多模态能力：基于手写文本指令构建网站、生成详细准确的图像描述、解释丰富有趣的视觉现象……不过，需要说明的是，OpenAI

大语言模型 GPT-4 OpenAI

DeepTech深科技 2023-05-12

AI手机竞争升级厂商角逐多模态大模型

华为、OPPO、小米等企业也均在自己的操作系统中集成了大模型技术，并将其向多模态模型加速迭代，预示着AI大模型将成为智能手机发展的重要驱动力，推动行业进入一个新的创新周期。”在华为、vivo等厂商的推动之下，…

华为 AI大模型

中国网科技 2024-05-17

近期资讯

华为官宣：奖金300万元！

奥林帕斯奖奖金100万元人民币（含税）/个，奥林帕斯先锋奖20万元人民币（含税）/个，合计300万元。

中国基金报 2024-12-29

SpaceX计划今年进行144次发射，已完成133次

钛媒体App12月29日消息，截至12月29日，SpaceX在2024年度已完成133次发射，距离该公司在年初设立的年度目标还差11次。

钛媒体快报 2024-12-29

雷科技编辑2024买了啥？手机、耳机最受宠，可穿戴无人问津？

2024年即将结束，这种辞旧迎新的时候，也是大家做年度复盘的最好时机。过去一个月里，雷科技已经发布了多个企业、行业的年度回顾和盘点。而作为年度盘点中的保留环节，接下来该盘点一下雷科技编辑部小伙伴今年买了些什么了。

雷科技 2024-12-29

AMD RX 9070 XT功耗超过300W！但拒绝16针供电

快科技12月29日消息，AMD的新一代显卡RX9070XT、RX9070将会在CES2025期间正式发布，预计1月底春节前就会上市，更多曝料也不断出现。不过在NVIDIA全线普及12V-2x616针供电接口的情况下，AMD并不会跟进，而是继续使用传统的PCIe8针接口，预计公版标配两个(最大供电能力就有375W)，非公版上三个也不罕见。

驱动之家 2024-12-29

【实探】华为手机，大降价！

12月29日，中国证券报·中证金牛座记者在华为旗舰店实探发现，近期，华为Pura70系列、MateX5等多款手机开启降价促销优惠。

中国证券报 2024-12-29

看看今年花多少支付宝年度总结来了：首页下拉可领

快科技12月29日消息，一年一度的支付宝年度总结终究还是来了！据介绍，支付宝首页下拉或下载“支小宝”App，输入“我的2024”，查看你的AI年度总结。马云在支付宝20周年纪念活动中表示，未来的20年，AI时代所带来的巨大的变革会超出所有人的想象，因为AI会是一个更加伟大的时代，AI会改变一切，但这并不代表AI会决定一切。

快科技 2024-12-29

AI用“错”了，人真的会变笨！没骗你

近两年来，AI技术发展迅猛，对我们生活渗透的速度，可以用一日千里形容。当工作中为了提效，和人工智能协作时，我们应该将人工智能视为一个古怪的队友，而不是一个无所不知的仆人。

科普中国 2024-12-29

国产大飞机进展神速，CR929突破大瓶颈，波音是否会退出我国市场

飞机作为现在常见的一种交通工具，频繁地接受着人们的运输任务，而要说中国最缺的其实就是国产的大型飞机。一提到国产大型飞机，大家一定会先想到C919，但这种机型现在已经难以满足我国的一些应用条件，在这样的情况之下，我国和俄罗斯选择了共同研制，制造我国的CR929。

科学知识点秀 2024-12-29

基于数字化转型的中医药企业智慧供应链模式

智慧供应链作为企业提升竞争力的关键，如何助力中医药企业实现传统与现代的融合发展？通过采用先进的信息技术和管理模式，智慧供应链能够有效应对原材料供应不稳定、信息共享不畅和质量控制难题，进而推动中医药企业在传统与现代融合发展道路上更进一步。

人人都是产品经理 2024-12-29

史诗升级！iPhone 17将全系用上高刷

据供应链物料信息确认，iPhone17标准版将首次引入高刷新率技术，这在苹果历史上尚属首次。据透露，iPhone17的边框设计并未达到Pro版的超窄效果。

中关村在线 2024-12-29

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1