作者 | 冬梅自 2021 年初以来,随着大量深度学习支持的文本到图像模型(例如 DALL-E-2、Stable Diffusion 和 Midjourney 等)的诞生,人工智能研究的进展发生了革命性的变化。近日,谷歌Muse AI 系统正式亮相。据谷歌 Muse AI 团队称,Muse 是一种文本到图像的 Transformer 模型,该模型可以实现先进的图像生成性能。我们提...【查看原文】
出品|开源中国自 2021 年初以来,AI 领域推出大量基于文本到图像的模型(例如 DALL-E-2、Stable Diffusion 和 Midjourney 等)。近日,谷歌也公开了一款名为 “Muse” 的基于文本生成图像的模型,声称可以实现最先进的图像生成性能。 下图均为 Muse 的基于文本生成的图像一群鱼在海里拼成 “MUSE” 字样嘴里叼着 “MU...
谷歌Stable DiffusionMidjourney
OSCHINA 2023-01-09
#元宇宙 12 月 7 日消息,谷歌官方宣布发布 Gemini1.0,这是其认为规模最大、功能最强大的人工智能模型,可以处理视频、音频和文本等不同内容形式的信息。#AI谷歌在多种任务上评估了两种模型的性能,从自然图像、音频、视频理解到数学推理,Gemini Ultra 在 32 个常用的学术基准的 30个上,已经超越 GPT-4。#大模型 #生成式AI #谷歌Gemini
谷歌AI大模型人工智能生成式AI元宇宙
元宇宙新声 2023-12-13
Stability AI宣布推出Stable Diffusion XL 1.0,这是一个文本到图像的模型,该公司将其描述为迄今为止“最先进的”版本。Stability AI表示,SDXL 1.0能生成更加鲜明准确的色彩,在对比度、光线和阴影方面做了增强,可生成100万像素的图像(1024×1024)。而且还支持在网页上直接对生成图像进行后期编辑。提示词也能比之前更简单了。这是因为SDXL 1.0的基础模型参数量达到了35亿,理解能力更强。对比基础版Stable Diffusion,参数量只有10
Stability AIStable Diffusion XLStable Diffusion提示词
AI研习所 2023-07-29
人工智能的发展让创作者保持警惕。每隔一周就会有一个新的 AI 工具、平台或功能可供探索。在我的列表顶部是为几个即将进行的项目制作动画人物面孔。我需要创建一致的、分层的或复杂的图像以用于这些项目。例如,D-ID是一款网络应用程序,它使用实时面部动画和高级文本到语音转换来创建身临其境的类人对话式AI体验。Midjourney 的“/describe”功能可让您将图像转换为文字。它会根据您上传的图片生成四种不同的描述,并且可以轻松生成新的变体。底部的四个数字是混音按钮——每个数字都与相应的描述相匹配。单击数字将
ChatGPTMidjourney人工智能
清大文森学堂 2023-04-18
DoNews12月6日消息,一支来自卡内基梅隆大学和HuggingFace的研究团队表示,不同的生成式AI模型在能耗方面也有不同的表现。据品玩报道,研究团队对聊天机器人、文本生成模型以及图片生成模型在内的各种模型的碳排放量和能耗进行了测量。
Hugging Face生成式AI
DoNews 2023-12-06
金融界2024年12月26日消息,国家知识产权局信息显示,深圳国荟数智科技有限公司申请一项名为“一种适用于会议系统的无线音频星闪传输噪声管理方法及系统”的专利,公开号CN119181344A,申请日期为2024年8月。
金融界 2024-12-26
金融界2024年12月26日消息,国家知识产权局信息显示,西藏峦赛智慧物联工程有限公司取得一项名为“一种便于维护的新能源充电桩”的专利,授权公告号CN222202282U,申请日期为2024年4月。
金融界2024年12月26日消息,国家知识产权局信息显示,平安科技(深圳)有限公司申请一项名为“语音生成方法、装置、电子设备及存储介质”的专利,公开号CN119181346A,申请日期为2024年9月。专利摘要显示,本申请实施例提供了一种语音生成方法、装置、电子设备及存储介质,属于人工智能技术领域。
金融界2024年12月26日消息,国家知识产权局信息显示,深圳市易思态科技有限公司申请一项名为“基于蓝牙传输的同声传译方法、装置、设备及介质”的专利,公开号CN119181365A,申请日期为2024年9月。
金融界2024年12月26日消息,国家知识产权局信息显示,北京字跳网络技术有限公司申请一项名为“用于语音处理的方法、装置、设备、存储介质和产品”的专利,公开号CN119181362A,申请日期为2024年9月。专利摘要显示,根据本公开的实施例,提供了用于语音处理的方法、装置、设备、存储介质和产品。
金融界2024年12月26日消息,国家知识产权局信息显示,深圳市斯远电子技术有限公司申请一项名为“音频处理方法、装置、电子设备及计算机可读存储介质”的专利,公开号CN119181351A,申请日期为2024年8月。
金融界2024年12月26日消息,国家知识产权局信息显示,未势能源科技有限公司取得一项名为“燃料电池系统的空压机组件、防撞支架以及车辆”的专利,授权公告号CN222202271U,申请日期为2024年1月。
金融界2024年12月26日消息,国家知识产权局信息显示,保时捷(上海)数字科技有限公司申请一项名为“用于语音可激活的设备的方法及相应的装置、设备和车辆”的专利,公开号CN119181354A,申请日期为2023年6月。专利摘要显示,本发明提供了用于语音可激活的设备的方法及相应的装置、设备和车辆。
金融界2024年12月26日消息,国家知识产权局信息显示,上海任意门科技有限公司申请一项名为“一种语音合成方法、装置、电子设备及存储介质”的专利,公开号CN119181349A,申请日期为2024年11月。
金融界2024年12月26日消息,国家知识产权局信息显示,嘉善浩业电子科技有限公司取得一项名为“一种用于充电桩的多方位散热系统”的专利,授权公告号CN222202283U,申请日期为2024年4月。专利摘要显示,一种用于充电桩的多方位散热系统包括安装板,充电元器件,第一散热单元,以及第二散热单元。
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1