当前位置:首页|资讯|Midjourney|文心一言

AI视野:Midjourney开始训练视频模型;文心一言用户破亿;

作者:站长之家发布时间:2023-12-28

原标题:AI视野:Midjourney开始训练视频模型;文心一言用户破亿;

📰🤖📢AI新鲜事

Midjourney开始训练视频模型

Midjourney昨晚发布了重要消息,将开始视频模型训练,同时计划下周推出V6版本的重大更新。该更新将在文本处理方面有显著进步,提高内容连贯性和提示准确性。重点改进包括Inpainting功能和全新的风格调整器,为V7版本的重大更新做准备。

【AiBase提要:】
🚀 视频模型训练启动: Midjourney宣布即将开始视频模型训练,拓展其领先地位。
🆕 V6版本重大更新: 下周V6版本将推出,带来文本处理方面的显著进步,包括Inpainting功能和全新风格调整器。
🔮 V7版本预告: Midjourney透露V7版本将是一次重大更新,预示在视频生成领域竞争中的强劲实力。

文心一言用户破亿

百度首席技术官王海峰在WAVESUMMIT大会上宣布,文心一言用户数量突破1亿,与飞桨开发者规模达到千万。

【AiBase提要:】
🚀 文心一言用户已突破1亿,自8月31日开放服务以来,用户提问量与模型效果同步提升。
🛠️ 文心一言作为百度核心技术之一,在语义理解和自然语言处理领域取得显著成就。
💻 与文心一言技术深度绑定的百度飞桨开发平台成功发展,开发者规模已超过千万,达到1070万。

三星新推AI智能冰箱

三星推出2024Bespoke4-DoorFlexRefrigerator,内置摄像头识别食物,App提供个性化食谱建议,32英寸触摸屏支持TikTok和YouTube,强化AI功能。

【AiBase提要:】
🌿 内置摄像头辨识食物,App提供个性化食谱建议。
📲 与Galaxy手机镜像,32英寸触摸屏支持TikTok和YouTube。
🍽️ 强化的AI功能,如视觉AI识别食物并提供更多定制化选项。

阿里发布《AIGC治理与实践白皮书》

阿里巴巴携手中国电子技术标准化研究院发布《AIGC治理与实践白皮书》。阿里强调在AI发展中建立防火墙,同时突破AI应用的天花板,与社会共同解决问题,推动AI造福更广泛人群。

【AiBase提要:】
🔥 发展防火墙: 阿里致力于在AI领域筑牢发展的防火墙,确保安全发展。
🚀 突破天花板: 阿里强调不断突破AI应用的天花板,迎接前所未有的挑战。
🤝 社会共创: 阿里betway体育注册努力与社会各界合作,共同利用AI技术解决社会难题,推动AI造福更多人。

《纽约时报》起诉微软和OpenAI

纽约时报起诉微软和OpenAI,指责它们侵犯版权、滥用报纸知识产权,要求数十亿美元的法定和实际损害赔偿。

【AiBase提要:】
📰 侵权指控:微软和OpenAI被指控侵犯《纽约时报》版权,滥用报纸知识产权用于训练ChatGPT语言模型。
🤝 合作寻求解决方案:OpenAI表示对起诉感到失望,强调与媒体机构的对话,寻求互利合作方式,但未透露具体细节。
🔍 AI模型竞争与商业机会限制:纽约时报指责微软和OpenAI的GPT模型与其内容直接竞争,同时改变内容限制了时报的商业机会,引发媒体机构对人工智能模型的担忧。

比尔·盖茨预测人工智能将引发技术爆炸

比尔·盖茨预测人工智能将在未来18至24个月内迎来广泛应用,特别关注其在发展中国家的应用,强调全球卫生领域的平等性。

【AiBase提要:】
💡 盖茨预测人工智能将在未来18至24个月内广泛应用,加速科技领域的新发现。
🌍 盖茨关注人工智能在发展中国家的应用,特别强调在全球卫生领域的平等性。
🚀 盖茨指出人工智能在教育、抗击疾病等方面的多个应用案例,强调应根据各国实际情况进行调整。

🤖📈💻💡大模型动态

深言科技“语鲸大模型”通过备案

深言科技的“语鲸大模型”已通过备案,具备强大的语义理解与文本生成、代码理解等能力,将在文本创作、数学计算、代码补全等领域向社会公众开放服务。

【AiBase提要:】
🐋 技术实力: 深言科技的“语鲸大模型”在中文理解和生成方面领先,80亿参数的LingoWhale-8B模型已在多个评测基准上达到领先效果。
📅 产业合作: 入选“北京市通用人工智能产业创新伙伴计划”,并与清华大学NLP实验室合作,致力于推动人工智能产业创新。
🌐 开源与商用: LingoWhale-8B模型已开源供学术研究免费使用,商业用途需申请授权,展示深言科技在大模型领域的技术实力。

字节发布AI模型DiffPortrait3D

DiffPortrait3D是字节跳动团队开发的条件扩散模型,通过零样本能力,从一张肖像图生成逼真、多样的3D面部视图,支持不定姿态、夸张表情和各种艺术风格。

【AiBase提要:】
🌐 独特技术:DiffPortrait3D采用2D扩散模型生成先验,结合条件控制模块、交叉视图注意力模块和3D感知噪声生成机制,实现多视角、野外场景下的高质量3D人像合成。
📸 零样本方法:通过零样本方法,DiffPortrait3D能够从单一肖像生成3D一致的新视图,支持不规定相机视角、极端面部表情和多样艺术描绘,无需繁琐微调。
🔬 综合优势:引入条件控制模块、交叉视图注意力模块和3D感知噪声生成机制,确保在合成图像中保持面部特征一致性,经过多视角和野外基准测试展现出逼真高质量的3D面部重建。

🤖📱💼AI应用

优酷上线“AI搜片”功能

一项全新的AI功能“AI搜片”在优酷上线,被称为全网首个AI对话类影视搜索引擎。用户可通过多轮对话实现模糊搜索、影视问答等功能,提升搜索体验,使影视内容查找更智能和个性化。

【AiBase提要:】
🔍 优酷推出全新AI功能“AI搜片”——首个AI对话类影视搜索引擎。
🎙️ 用户通过对话实现模糊搜索、影视问答,无需具象问题即可完成搜索。
🌐 涵盖全网百万级影视剧实体信息,融合万亿条文娱相关知识词条,提升用户搜索体验。

👨‍💻💡🎯聚焦开发者

腾讯MotionCtrl正式开源

腾讯视频发布的MotionCtrl视频运动控制器正式开源,具有高度自定义相机和物体运动轨迹,实现精细多样化运动控制。

Demo:https://huggingface.co/spaces/TencentARC/MotionCtrl

项目地址:https://top.aibase.com/tool/motionctrl

【AiBase提要:】
🔄 MotionCtrl开源:腾讯视频发布的MotionCtrl视频运动控制器正式开源。
📹 多样化运动控制:项目可高度自定义相机和物体在3D空间的运动轨迹,实现更精细和多样化的运动控制。
🌐 架构优势:MotionCtrl独立控制摄像机和物体运动,考虑了它们的固有属性,提高了运动控制的灵活性。

快手开源KwaiAgents系统 性能超越GPT-3.5

快手与哈尔滨工业大学联合研发的「KwaiAgents」系统成功开源,通过Meta-Agent Tuning方法提升7B/13B模型性能,超越了GPT-3.5。

项目地址:https://github.com/KwaiKEG/KwaiAgents

【AiBase提要】
🚀 开源项目优势: 快手联合哈尔滨工业大学开源「KwaiAgents」系统,包含轻量级AI Agents系统、通用能力大模型、自动化评测Benchmark,为研究者提供便利。
🔄 Meta-Agent Tuning方法: 通过MAT方法,引入更多Agent Prompt模板,提升大模型在任务规划、工具使用、反思等能力,避免过拟合问题。
📈 性能超越GPT-3.5: 经过MAT调优后,7B-13B模型在各项能力上显著提升,评测结果显示超越了GPT-3.5效果。

字节推图像分割项目UniRef++

UniRef++项目由字节公司推出,通过整合即参考图像分割、少镜头图像分割、参考视频对象分割和视频对象分割四种方式,利用UniFusion模块和SAM模型提高图像分割效率和精确度。

论文地址:https://arxiv.org/pdf/2312.15715.pdf

【AiBase提要】
🔍 UniRef++整合四种图像分割方式,实现自动选择最适合任务的分割方式。
🔄 UniFusion模块与SAM模型结合,进一步提高图像分割效率和精确度。
🚀 项目允许在广泛基准上进行联合训练,提高资源利用效率,实验结果显示在不同任务上取得先进性能。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1