“在技术层面上,他们正在做一些非常简单的事情......但结果非常惊人。最重要的是,它在 OpenAI 的 GPT-4 图像模态之前出现。(这是)开源 AI 的真正胜利。”...【查看原文】
上个月GPT-4发布时,我曾写过一篇文章分享过有关GPT-4的几个关键信息。当时的分享就提到了GPT-4的一个重要特性,那就是多模态能力。比如发布会上演示的,输入一幅图(手套掉下去会怎么样?)。GPT-4可以理解并输出给到:它会掉到木板上,并且球会被弹飞。再比如给GPT-4一张长相奇怪的充电器图片,问为什么这很可笑?GPT-4回答道,VGA 线充 iPhone。用户甚至还可以直接画一个网站草图拍照丢给GPT-4,它就可以立马帮助生成代码。但是时间过去了这么久,GPT-4像这样的识图功能也迟迟没有开放。就在
GPT-4MiniGPT编程
CodeSheep 2023-04-20
机器之心 & ArXiv Weekly 参与:楚航、罗若天、梅洪源 本周论文包括慕尼黑大学、英伟达等机构的研究者利用潜在扩散模型(latent diffusion model, LDM)实现了高
MiniGPTStable Diffusion英伟达
机器之心 2023-04-23
机器之心 & ArXiv Weekly 参与:楚航、罗若天、梅洪源 目录 Align your Latents: High-Resolution Video Synthesis with Latent
MiniGPTStable Diffusion
机器之心 2023-04-24
梦晨 发自 凹非寺 量子位 | 公众号 QbitAIGPT-4识图功能迟迟不开放,终于有人忍不住自己动手做了一个。 MiniGPT-4来了,Demo开放在线可玩。传一张海鲜大餐照片上去,就能直接获得菜
OpenAIMiniGPT
量子位 2023-04-21
chatgpt虽然展示过了它的多模态能力,但是它还没有向大众开放图片对话功能。华人团队开发的MiniGPT-4填补了这个空白。你给它一张图片,它可以分析图片的内容,然后根据你的提问回答你相应的问题。官方展示了多个图片场景对话演示,MiniGPT-4对图片都分析的极其准确,而且回答问题也可以像Chatgpt那样智能聊天。下面看一下官方的效果展示。给它一张杯子的图片,让minigpt4写一段广告文案,minigpt4成功识别出图片中的内容,并描述了杯子样式及其推广卖点,写了一篇有创意的广告文案。给了minig
MiniGPTChatGPT
AI画师大阳 2023-04-28
腾讯科技 2024-12-28
IT之家 2024-12-28
聚焦中国公司全球化大事、提供世界各地最新创投新闻;36氪出海致力于消除信息差,让读者将本周最值得关注的大事件尽收眼底。
36氪出海 2024-12-29
身处分散、不易标准化的行业,又该如何做出规模?
中国企业家杂志 2024-12-29
做的所有事情,都是为了拿门票。
镜相工作室 2024-12-29
国内新的经济增长引擎开始发动。
职场Bonus 2024-12-29
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1