当前位置：首页|资讯

信息港小镇企业一知智能让照片“活”起来

作者：新报观察发布时间：2024-09-04

最近，信息港小镇企业杭州一知智能科技有限公司自研的通用说话人合成技术上线，能让静态照片“开口说话”。

什么是通用说话人合成技术？这是一种基于智能算法的图像处理技术，它能根据语音直接驱动静态照片中人物头部和面部自然动作，不需要定制训练，即可生成人物流畅说话的视频效果。

也就是说，仅需一张图片，一段音频，就能让图片中的人物“活”起来。

那么，通用说话人合成技术是如何做到的？一知智能相关负责人介绍，首先，在语音特征方面，采用基于Transformer的语音特征聚合模型，来提取每一帧画面对应的语音特征。同时，通过motion extractor提取头部姿态和表情偏移量，在实际使用中可以用模板库中丰富的头部姿态序列进行驱动，“这样子，我们就将关键点、语音特征、运动信息和图片特征通过聚合模型进行了融合，并利用扩散模型重建了头部图像。想象一下，你只需上传一张自己满意的照片和一段音频，就能得到一个动态的你，是不是很有趣？”

值得一提的是，基于过去为众多电商品牌拍摄的定制或公用模特，一知智能构建了丰富的头面部动作与表情模型库，这使得通用说话人合成技术能够创造出自然又真实的多样化面部表情与动作，精准匹配声音与细腻表情变化。

实际上，这项技术的突破，不仅仅使一知智能在通用式唇音匹配效果上处于业界领先地位，更极大降低了数字人制作的经济与时间成本，“我们摒弃了前期对摄影棚拍摄和专业化妆师团队的依赖，仅凭单图就可驱动出高真实度、高可控性、高表现力的数字人，与定制化数字人模型所差无几。”

一直以来，一知智能不断探索AI多模态人机交互的新边界，致力于将AI深度融入业务场景。该技术提升了数字人制作的灵活性与效率，也为一知的业务拓展开辟了新视野，带来更多可能性。(周珂冯佳程)

推荐体验

相关资讯

迁安信息港大事件→小编即将被取代？咋回事

ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，并协助我们完成一系列任务。小编也和它聊天了，让我们看看它…

ChatGPT 人工智能 OpenAI

迁安信息港 2023-04-03

AI让应县木塔“活”起来

对木塔的保护与修缮工作虽一直在进行中，但这座千年木塔的复杂性，也给修缮工作带来巨大的挑战。在刘畅的指导下，AIGC智慧木塔技术团队利用现有的素材去推导出辽代的历史文化，在VR应用中艺术化地叠加木塔各个历史时期…

拍者 2024-07-28

如何让一张照片动起来？

“DALL·E-2”是一款能够根据文本描述创造视觉图像的AI系统。“Midjourney”是一款利用AI算法将文本转化为图像的软件。“AnimatedDrawings”是一款为插画师和设计师提供动态插画和动画…

DALL·E Midjourney

刘艳伟爱生活 2024-06-27

ChatGPT的大火让人工智能又“活”了起来

跨国金融服务公司UBS近日发布了一篇研究报告显示，各项技术中，“当红炸子鸡”ChatGPT达到全球1亿用户所需时间仅用2个月，而电话用了75年，手机的普及则用了16年。人工智能被视为下一代技术的核心应用，但是一直以来被人诟病的在于缺乏杀手级应用，只是一个生活在实验室的温室花朵。

ChatGPT 人工智能金融

金融界 2023-02-06

玩转AIGC消除功能，让普通照片变得高级起来

首先，让我们一起康康AIGC消除功能是什么？简单来说，它是一种基于人工智能的图像处理技术，可以智能识别画面中的不想要的元素，并自动去除，同时生成完美的补足画面，让“废片”变成能直接发朋友圈的“好片”！那怎么在OppoFindX7Pro上开启呢？小手一抖，视频就能瞬间变高级，即刻拥有电影级画面质感！以下是操作步骤️点击相机️向左滑动进入专业模式️点击AIGC消除功能按钮️选择想要消除的元素，再点击对号即可这时，你会发现被消除的元素直接从画面上消失不见，画面看起来更加纯净、高级，实在是太棒了这个功能在光线复杂

AIGC 人工智能

Cool说 2024-01-20

近期资讯

严阵以待！普陀落实各项措施全力防御台风“贝碧嘉”

今年第13号台风“贝碧嘉”预计将于15日夜间到16日上午在浙北到上海一带登陆。针对在建工地、易积水小区、下立交、玻璃幕墙、店招店牌等重点部位，应急人员连夜开展了全面细致排查，切实消除安全隐患。同时，严格落实领导带班、24小时值班制度，进一步压实防汛责任，密切关注台风动向，加强预警预报，做好“首报、续报、终报”。

东方网 2024-09-15

五问台风“贝碧嘉” ！留意近海加强风险！关注风暴潮叠加影响

今年第13号台风“贝碧嘉”逐渐逼近我国，其潜在影响引起广泛关注。当前，台风“贝碧嘉”具有较强的强度，这主要由于其长时间的生成至登陆过程（超过5天）为台风的充分发展提供了时间窗口。三问：“贝碧嘉”的风雨影响是否会与天文大潮叠加？

极目新闻 2024-09-15

天龙股份取得金属零件漏装检测机构专利，能够适用于检测不同高度误差的金属零件

金融界2024年9月15日消息，天眼查知识产权信息显示，宁波天龙电子股份有限公司取得一项名为“金属零件漏装检测机构“，授权公告号CN221686663U，申请日期为2024年8月。”

金融界 2024-09-15

华硕 ROG 外设新品发布会定档 9 月 20 日，含键盘、鼠标等

IT之家9月15日消息，华硕今日官宣ROG外设新品发布会定档9月20日19:00，将带来魔导士ACEHFX磁轴键盘和龙鳞ACEMINI鼠标、ROG回报率加速器等。三模链接Omni接收器/ROG回报率加速器（无线8KHz）。

IT之家 2024-09-15

银河麒麟嵌入式操作系统 V10 SP1 Update1 更新支持 .NET 6.0

IT之家9月15日消息，银河麒麟嵌入式操作系统V10SP1Update1更新，重点针对飞腾平台和瑞芯微平台进行了功能增强与优化，增加了.NET6.0框架支持，并进一步优化用户体验和“系统更新”功能。支持飞腾UBOOT启动，适配JM9100显卡。

IT之家 2024-09-15

广电总局部署全国酒店电视终端以旧换新工作：鼓励置换超高清电视

IT之家9月15日消息，9月13日，国家广播电视总局联合工业和信息化部、商务部、文化和旅游部，召开全国酒店电视终端以旧换新动员部署会。中国广电、中国电信、中国移动、中国联通负责人参加会议，锦江、洲际、小米、TCL、京东、苏宁易购负责人作交流发言。

IT之家 2024-09-15

江苏迈邦生物科技取得一种医用引流管专利，避免引流管体发生弯折，提高引流效率

金融界2024年9月15日消息，天眼查知识产权信息显示，江苏迈邦生物科技有限公司取得一项名为“一种医用引流管“，授权公告号CN221673094U，申请日期为2023年12月。”专利摘要显示，本实用新型公开了一种医用引流管，涉及医疗辅助器械技术领域。

金融界 2024-09-15

一键暂停视频看全屏广告，消费者苦互联网“牛皮癣”久矣

9月13日，一条“谁来管管疯狂的弹窗广告”冲上了微博热搜，在讨论区许多消费者大吐苦水，目前主流的几个视频平台没一个能逃过消费者的吐槽。

北青网 2024-09-15

华为公司取得可穿戴设备专利，提高了灵敏度，能够及时给作业人员提供近电风险告警，以有效保障作业人员在带电环境下作业的安全性

金融界2024年9月15日消息，天眼查知识产权信息显示，华为技术有限公司取得一项名为“可穿戴设备“，授权公告号CN221687041U，申请日期为2023年11月。”

金融界 2024-09-15

“超级中秋月”来了，赏月最佳时段→

“一年逢好夜，万里见明时。”每年中秋，赏月都是重头戏。天文科普专家表示，今年中秋是“十五的月亮十六圆”，还是一轮“超级月亮”。欣赏这轮大圆月亮。星空摄影师申然2023年9月29日（农历八月十五）在上海拍摄的中秋月，也是一轮“超级月亮”。

光明网 2024-09-15

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1