编辑:拉燕 【新智元导读】微软&哥大联合发表视觉指令微调论文,LLaVA出炉! 视觉指令微调火了。 这篇论文名为Visual Instruction Tuning,由威斯康星大学麦迪逊分校,微软研究院...【查看原文】
微软&哥大联合发表视觉指令微调论文,LLaVA出炉!
GPT-4微软
新智元 2023-04-28
看看本周新进展本周带来的 8 个 SOTA 模型分别用于多模态对话、对话系统、文本到语音生成、中文医学对话等;1 个工具用于三维视觉重建;1 个数据集用于自然语言处理。阿卜杜拉国王科技大学开源MiniGPT-4,具备类GPT-4的图像理解与对话能力的多模态大模型MiniGPT-4 是阿卜杜拉国王科技大学开源的一款多模态大模型,同时具备图像理解与对话能力。它使用 BLIP-2 的冻结视觉编码器和 Vicuna 的冻结 LLM,仅使用一个投影层进行对齐。MiniGPT-4 的训练分为两个阶段。第一阶段是传统的
GPT-4MOSSMiniGPTVicuna
AI试库の小土同学 2023-04-24
GPT-4重磅发布,拥有多模态大模型的光环加持,将会给我们带来哪些眼前一亮的技术呢,今天就让我们来揭开GPT-4能力的面纱
GPT-4
江湖修行 2023-03-16
这几天,17岁中专生姜萍在2024阿里巴巴全球数学竞赛预选赛中取得全球第12名的新闻刷了屏。而同时,AI挑战赛的成绩显示,在所有563支AI参赛队伍中,最高分34分,平均分18分,赶上了人类选手平均水平。AI参与数学竞赛的主要短板是逻辑推理能力弱,证明题很难拿到完整得分点。
LLaMAGPT-4阿里巴巴
机器之心Pro 2024-06-17
大模型之争,又卷起来了。据Theinformation爆料称,OpenAI即将推出多模态模型GPT-vision。如果消息为真,这将是OpenAI在GPT-4之后推出的最大更新。另一边,谷歌的多模态模型进展也在最近传出,为的就是能和OpenAI抗衡。目前为止,OpenAI还没有对爆料中的传闻做出回应,但此前发布过多模态模型测试。
OpenAI谷歌GPT-4
量子位 2023-09-19
有人摸到了智驾的康庄大道吗?
海豚投研 2024-12-27
国企退休前夕,我卖掉一套房子独自去留学
一条 2024-12-27
对流量和大IP祛魅。
文娱先声 2024-12-27
食品安全始终是餐饮企业的底线
斑马消费 2024-12-27
起起伏伏的2024剧集
娱乐独角兽 2024-12-27
徐翔家族资本市场还有多少布局?
野马财经 2024-12-27
299个模块“拼出”航站楼
36氪的朋友们 2024-12-27
官方机构下场、主打免费和便利,政府版“房产超市”对现有的房产交易行业,会是很大的冲击吗?
未来城不落 2024-12-27
给汽车出海上了一课
剁椒Spicy 2024-12-27
中长视频的内容生态已经建立了。
刺猬公社 2024-12-27
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1