惊！读取大脑重建高清视频，Stable Diffusion还能这么用

作者：量子位发布时间：2023-05-23

Stable Diffusion

金磊发自凹非寺

量子位 | 公众号 QbitAI

现在，AI可以把人类 脑中的信息，用 高清视频展示出来了！

例如你坐在副驾所欣赏到的沿途美景信息，AI分分钟给重建了出来：

看到过的水中的鱼儿、草原上的马儿，也不在话下：

这就是由新加坡国立大学和香港中文大学共同完成的最新研究，团队将项目取名为 MinD-Video。

这波操作，宛如科幻电影《超体》中Lucy读取反派大佬记忆一般：

引得网友直呼：

推动人工智能和神经科学的前沿。

值得一提的是，大火的Stable Diffusion也在这次研究中立了不小的功劳。

怎么做到的？

从大脑活动中重建人类视觉任务，尤其是 功能磁共振成像技术（fMRI）这种非侵入式方法，一直是受到学界较多的关注。

因为类似这样的研究，有利于理解我们的认知过程。

但以往的研究都主要聚焦在重建静态图像，而以高清视频形式来展现的工作还是较为有限。

之所以会如此，是因为与重建一张静态图片不同，我们视觉所看到的场景、动作和物体的变化是连续、多样化的。

而fMRI这项技术的本质是测量血氧水平依赖（BOLD）信号，并且在每隔几秒钟的时间里捕捉大脑活动的快照。

相比之下，一个典型的视频每秒大约包含30帧画面，如果要用fMRI去重建一个2秒的视频，就需要呈现起码60帧。

因此，这项任务的难点就在于解码fMRI并以远高于fMRI时间分辨率的FPS恢复视频。

为了弥合图像和视频大脑解码之间差距，研究团队便提出了MinD-Video的方法。

整体来看，这个方法主要包含两大模块，它们分别做训练，然后再在一起做微调。

这个模型从大脑信号中逐步学习，在第一个模块多个阶段的过程，可以获得对语义空间的更深入理解。

具体而言，便是先利用大规模无监督学习与mask brain modeling （MBM）来学习一般的视觉fMRI特征。

然后，团队使用标注数据集的多模态提取语义相关特征，在对比语言-图像预训练（CLIP）空间中使用对比学习训练fMRI编码器。

在第二个模块中，团队通过与增强版Stable Diffusion模型的共同训练来微调学习到的特征，这个模型是专门为fMRI技术下的视频生成量身定制的。

如此方法之下，团队也与此前的诸多研究做了对比，可以明显地看到MinD-Video方法所生成的图片、视频质量要远优于其它方法。

而且在场景连续变化的过程中，也能够呈现高清、有意义的连续帧。

研究团队

这项研究的共同一作，其中一位是来自 新加坡国立大学的博士生Zijiao Chen，目前在该校的神经精神疾病多模式神经成像实验室（MNNDL_Lab）。

另一位一作则是来自 香港中文大学的Jiaxin Qing，就读专业是信息工程系。

除此之外，通讯作者是新加坡国立大学副教授Juan Helen ZHOU。

据了解，这次的新研究是他们团队在此前一项名为MinD-Vis的功能磁共振成像图像重建工作的延伸。

MinD-Vis已经被CVPR 2023所接收。

— 完—

「AIGC行业社群」招募中！

欢迎关注AIGC的伙伴们加入AIGC行业社群，一起学习、探索、创新AIGC！

加好友请备注「AIGC」&「姓名-公司-职位」噢 ~

点这里 👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

相关资讯

读取大脑重建高清视频，Stable Diffusion还能这么用

科幻走进现实

Stable Diffusion

量子位 2023-05-23

近期资讯

使用vscode以及chrome调试yarn源码

在已经打包出带有sourcemap的yarn产物后可以通过vscode以及chrome对yarn源码进行调试

一只小川 2024-12-29

Java面向对象知识总结

202402150352 第1章初识Java与面向对象程序设计核心概念和知识点 Java是一种非常流行的编程语言，它简单易学，并且具有很强的安全性和跨平台特性。这意味着你可以在一个平台上编写Jav

用户98299515565 2024-12-29

从零实现LevelDB 3. MemTable实现

在本节，我们将会了解并实现： 1. LevelDB的内部键InternalKey和LookupKey及对应的比较器 2. Memtable

李沐阳_ 2024-12-29

MVCC原理以及解决脏读、不可重复读、幻读问题

MVCC是什么？有什么作用？ MVCC即多版本并发控制，每行数据存在多个事务版本，通过对数据多个版本的访问可以使读操作不会阻塞写操作，写操作不会阻塞读操作。我们所使用的mysql，其默认引擎为innd

轻浮j 2024-12-29

Pandas数据应用：股票数据分析

一、引言在当今的金融领域，股票市场是一个复杂且动态的系统。每天都有大量的交易发生，这些交易记录了价格、成交量等信息。对于投资者和分析师来说，如何从海量的数据中提取有用的信息是至关重要的。Pandas

Jimaks 2024-12-29

Java 异常处理：原理、实践与最佳策略

Java 异常处理：原理、实践与最佳策略在程序开发中，异常处理是一项重要的技能。无论是读取文件、访问数据库还是处理用户输入，异常随时可能发生。通过合理的异常处理，程序可以更具健壮性，避免因未处理的异

Java移动技术栈 2024-12-29

MySQL数据库连接池

关键技术点 MySQL数据库编程单例模式 queue队列容器 C++11多线程编程、线程互斥、线程同步通信和 unique_lock 基于CAS的原子整形、智能指针shared_ptr lambda

暗渡 2024-12-29

深入探索前端开发中的浏览器事件模型与请求处理

深入探索前端开发中的浏览器事件模型与请求处理在前端开发领域，浏览器事件模型和请求处理是构建交互性强、高性能网页应用的核心要素。作为前端开发者，深入理解这些概念并熟练运用相关技术，对于打造优质用户体验

十里八乡有名的后俊生 2024-12-29

Vben5登录过期无法再次登录问题，http状态码

记录vben在登录过期时出现了无法再次登录的问题，axios拦截器的问题，修改后端响应使用http状态码即可

无奈何杨 2024-12-29

Java中的String.valueOf()和toString()方法详解

在Java编程中，字符串操作是开发者日常编程任务中不可或缺的一部分。尤其是在处理对象和基本数据类型时，将其转换为字符串是一种常见需求。

Huooya 2024-12-29

惊！读取大脑重建高清视频，Stable Diffusion还能这么用

推荐体验

相关资讯

读取大脑重建高清视频，Stable Diffusion还能这么用

Stable Diffusion应用场景大突破，重建大脑信号，直逼脑机接口！

用 stable diffusion 制作美女视频以及重绘

且曼学院Stable Diffusion专业系统课2023年【画质高清只有视频】

高清女人像生成 Stable Diffusion on Colab

近期资讯

使用vscode以及chrome调试yarn源码

Java面向对象知识总结

从零实现LevelDB 3. MemTable实现

MVCC原理以及解决脏读、不可重复读、幻读问题

Pandas数据应用：股票数据分析

Java 异常处理：原理、实践与最佳策略

MySQL数据库连接池

深入探索前端开发中的浏览器事件模型与请求处理

Vben5登录过期无法再次登录问题，http状态码

Java中的String.valueOf()和toString()方法详解

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响