自OpenAI推出 Sora 以来,「文生视频」概念及相关应用备受瞩目。而伴随 Sora 的大热,其背后的关键技术,DiT(Diffusion Transformers) 也被「考古挖掘」了出来。 事...【查看原文】
自 OpenAI 推出 Sora 以来,「文生视频」概念及相关应用备受瞩目。而伴随 Sora 的大热,其背后的关键技术,DiT (Diffusion Transformers) 也被「考古挖掘」了出来。 [图片] 事实上,DiT 是一个文生图模型,该模型于两年前开源,其研发人员分别是 Peebles 和谢赛宁,其中 Peebles 也是 Sora 的项目领导者之一。 在 DiT 模型提出之前,Transformer 以其强大的特征提取和上下文理解能力,几乎在自然语言处理领域独霸一方。而 U-Net 则以其
OpenAISora
HyperAI超神经 2024-05-28
小朋友不爱背诗怎么办?《千秋诗颂》试试看。 [图片] 2 月 26 日,中国首部文生视频 AI 系列动画《千秋诗颂》于 CCTV-1 频道正式播出,这部动画由上海人工智能实验室和「央妈」(中央广播电视总台)强强联手,借助「央视听媒体大模型」,从美轮美奂的画面到动感十足的效果,直接把古诗里的世界带到小朋友眼前。 据了解,「千秋诗颂」综合运用了可控图像生成、人物动态生成、文生视频等最新技术成果,其背后的智囊团上海人工智能实验室的研究人员一直深耕于文生图、文生视频等领域,早在 2023 年年底就发布了全球第一个
人工智能Sora
OpenBayes 2024-05-30
1888 年,爱迪生提交了一项名为「活动电影放映机」的专利,该设备首次实现连续播放静态照片,形成类似动态画面的效果,由此拉开了视频发展的序幕。 回顾历史,视频经历了从无到有、从黑白到彩色、从模拟信号到数字信号的迭代。过去,视频的制作包括了脚本/剧本创作、拍摄、剪辑、配音、校审等多个步骤。时至今日,小到短视频平台的爆款视频,大到剧院内热映的大制作电影,仍然遵循着这一长链条的制作形式。 近年来,随着生成式 AI 的出现,视频的制作也迎来创新。自 ChatGPT 横空出世以来,生成式 AI 在文字理解方面的能力
SoraChatGPT
HyperAI超神经 2024-03-26
文生图界的「扛把子」重磅登场!千呼万唤,Stability AI 终于推出了开源模型 Stable Diffusion 3 Medium,该模型包含 20 亿参数,在图像质量、复杂提示理解以及资源效率方面都有显著提升,能够生成细节逼真、色彩鲜艳、光照自然的图像,并能适应多种风格!HyperAI超神经现已上线「ComfyUI Stable Diffusion 3 工作流在线教程」,已经为大家搭建好了环境,使用时无需输入任何命令,一键克隆即可启动。该教程将 Stable Diffusion 3 Medium
Stable DiffusionStability AI
HyperAI超神经 2024-07-24
近日,Colossal-AI团队开源了全球首个类Sora架构视频生成模型「Open-Sora 1.0」。本次开源的内容涵盖了整个训练流程,包括数据处理、训练细节和模型权重。开源仅两天,已在GitHub上斩获7k星!该项目支持完整的视频数据预处理、加速训练、推理等,只需 3 天的培训即可制作 2 秒 512x512 视频。让我们先来一起看看Open-Sora生成的视频效果吧!夜晚熙熙攘攘的城市街道,充满了汽车大灯的光芒和路灯的环境光。生机勃勃的向日葵田。花朵整齐地排列,营造出一种秩序感和对称感。森林地区宁静
SoraGitHub汽车
AI-GitHub 2024-03-19
不管是出门旅行,还是日常通勤,充电宝都能让我们的手机、平板等设备保持充沛的电量。不过,充电宝的使用和充电方法,很多人可能并不太了解。
新报观察 2024-12-30
vivoY200+机身厚度仅7.99mm,重199g,却内置的6000mAh大电池,采用第二代硅碳负极材料,能量密度高达791Wh/L,较普通石墨电池至高提升11.15%。在2倍行业健康寿命的技术加持下,四年后电池健康度还能保持80%以。vivoY200+采用磐石抗摔结构,搭配2倍抗冲击强度的金刚盾玻璃。
大话百科天地 2024-12-30
10月,位于地下700米的江门中微子实验(JUNO)的中心探测器内部、世界最大的单体有机玻璃球,已经全部建成,进入建设的收官阶段。江门中微子实验有机玻璃球内径35.4米,由263块12厘米厚的烘弯球面板和上下烟囱粘接而成,有机玻璃净重约600吨,是世界最大的单体有机玻璃球。
南方都市报 2024-12-30
工具等,大家可以在这些应用里设置独立的密码保护。对于一些敏感信息,使用加密的云存储服务也是个不错的选择。这样一来,即使有人拿到你的手机,也无法轻易获取到你的重要数据。很多云存储服务提供了多重加密的功能,可以大大提升数据的安全性。还有一点需要注意的是,避免在公共场合使用敏感应用。
对人类大脑处理信息的能力进行研究后,美国加州理工学院的神经科学家发现,人类思考的速度并没有想象中的那么快。大脑处理信息的速度仅为每秒10比特,与计算机每秒能执行数万亿次操作根本无法相比。这一发现提出了一个有趣的悖论:我们的大脑究竟是如何过滤如此庞大的信息量,以便有效地感知世界并作出决策的?
北青网 2024-12-30
公司董事长杨友汉介绍,公司开展“智改数转”后,车间自动化率超过95%,生产周期缩短22.5%,综合运营成本降低5%,不良品率降至0.15%,生产效率和产品质量显著提升。2024年,金凌科技、速波赛等当地锂电企业借力锂电产业数字化综合赋能平台,实现生产效率平均提升25%,生产成本平均降低15%。
经济日报 2024-12-30
OPPOK12x自发布以来,就以其均衡的性能和实惠的价格,赢得了众多用户的青睐,在千元机市场中占据了一席之地。在年货节,这款手机更是以822元的惊爆价,成为了百元机市场中的一颗璀璨明星。OPPOK12x采用6.67英寸OLED直屏,分辨率高达2400×1080,像素密度394ppi,屏占比更是达到了92.2%。
昨天,荣耀首席影像工程师罗巍分享了一组手机“200X”变焦的内部仿真效果,并表示“看来支持200X有机会”。针对荣耀手机以后是否会支持放大至200倍,他表示“有可能哦”,而针对12倍以内长焦的后续优化计划,他说“端侧的我们也会有优化推出,不过比云测慢”。
中关村在线 2024-12-30
近日,小米生态链总经理陈波确认,小米MK71Pro机械键盘将于2025年1月1日在小米商城、小米有品开启众筹。据了解,这款键盘采用了Gasket结构+TTC轴设计,并且支持热插拔轴体更换。
用保鲜膜包裹食物加热会致癌?12月29日,由北京市科协、北京市委网信办主办,北京广播电视台、北京科技记者编辑协会承办的“智止流言探求真知——‘科学’流言求真榜十周年发布活动”在京举行,多位专家为公众梳理并“粉碎”过去10年在网络上广为传播的十大“科学”流言,帮助公众明辨是非。
中国青年网 2024-12-30
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1