“在技术层面上,他们正在做一些非常简单的事情......但结果非常惊人。最重要的是,它在 OpenAI 的 GPT-4 图像模态之前出现。(这是)开源 AI 的真正胜利。”...【查看原文】
上个月GPT-4发布时,我曾写过一篇文章分享过有关GPT-4的几个关键信息。当时的分享就提到了GPT-4的一个重要特性,那就是多模态能力。比如发布会上演示的,输入一幅图(手套掉下去会怎么样?)。GPT-4可以理解并输出给到:它会掉到木板上,并且球会被弹飞。再比如给GPT-4一张长相奇怪的充电器图片,问为什么这很可笑?GPT-4回答道,VGA 线充 iPhone。用户甚至还可以直接画一个网站草图拍照丢给GPT-4,它就可以立马帮助生成代码。但是时间过去了这么久,GPT-4像这样的识图功能也迟迟没有开放。就在
GPT-4MiniGPT编程
CodeSheep 2023-04-20
机器之心 & ArXiv Weekly 参与:楚航、罗若天、梅洪源 本周论文包括慕尼黑大学、英伟达等机构的研究者利用潜在扩散模型(latent diffusion model, LDM)实现了高
MiniGPTStable Diffusion英伟达
机器之心 2023-04-23
机器之心 & ArXiv Weekly 参与:楚航、罗若天、梅洪源 目录 Align your Latents: High-Resolution Video Synthesis with Latent
MiniGPTStable Diffusion
机器之心 2023-04-24
梦晨 发自 凹非寺 量子位 | 公众号 QbitAIGPT-4识图功能迟迟不开放,终于有人忍不住自己动手做了一个。 MiniGPT-4来了,Demo开放在线可玩。传一张海鲜大餐照片上去,就能直接获得菜
OpenAIMiniGPT
量子位 2023-04-21
chatgpt虽然展示过了它的多模态能力,但是它还没有向大众开放图片对话功能。华人团队开发的MiniGPT-4填补了这个空白。你给它一张图片,它可以分析图片的内容,然后根据你的提问回答你相应的问题。官方展示了多个图片场景对话演示,MiniGPT-4对图片都分析的极其准确,而且回答问题也可以像Chatgpt那样智能聊天。下面看一下官方的效果展示。给它一张杯子的图片,让minigpt4写一段广告文案,minigpt4成功识别出图片中的内容,并描述了杯子样式及其推广卖点,写了一篇有创意的广告文案。给了minig
MiniGPTChatGPT
AI画师大阳 2023-04-28
相较于传统四足机器人,轮足式四足机器人在实用性方面优势明显。
时代周报 2024-12-26
作为一名投资人,Alan与他的被投企业有着极强的连接,在聊天过程中,他会将被投企业的产品/业务,不由自主地说成是“我们的”产品。
36碳 2024-12-26
这是面向未来消费者的一封情书。
36氪的朋友们 2024-12-26
字节小米盯上AI硬件。
字母榜 2024-12-26
低空产业火爆。
投资界 2024-12-26
国家铁路局:预计全年全国铁路旅客发送量约43亿人。
夏天与你的声音💤 2024-12-26
随着Gemini家族的日趋完善、阵容的发展壮大,谷歌大模型将可代表用户完成更多现实工作。
极客邦科技InfoQ 2024-12-26
微软对 Windows 系统中的 Copilot 实现方式进行了又一次更新。
OpenAI大战特斯拉?
雷科技 2024-12-26
具身智能产业的发展,或将进入实际应用的新阶段。
紫金财经 2024-12-26
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1