全球最热的AI视频生成公司,创始人就读于杭二,是浙江第一个被哈佛本科提前录取的学生,其父是信雅达董事长
从ChatGPT,到Midjourney,再到国内百模大战,AIGC领域已经有一阵没有让人振奋的消息和产品,直到11月29日,一家仅四人的初创公司发布全新的AI视频生成工具。一整天,国内外社交平台、科技界都被它暴力刷屏。
AI生成的视频
这家名叫Pika的初创公司,也一跃成为全球最炙手可热的AI视频生成公司。而它的创始人郭文景曾就读于杭二中,是浙江第一个被哈佛本科提前录取的学生。
官网首页
全新AI视频生成工具刷屏国内外社交平台
11月29日,Pika正式推出Pika 1.0,并开启试用申请。这是一款AI视频生成工具,能够生成和编辑3D动画、动漫、卡通和电影等各种风格的视频。
通过它,你还可以对视频内容进行精准的控制和编辑,像是调整视频的宽高比、对一段已经拍摄好的视频进行局部重绘(更换视频中人物的衣服,给猩猩戴墨镜等),而这一切只需要一句话的描述。
眼下的AI视频生成工具,都在为视频的清晰度和流畅度努力,努力让它告别PPT。仅从官方发布的宣传片来看,与现阶段同类公司产品相比,Pika 1.0已经可以很流畅地生成一段视频,转换也仅在一瞬间。
国内外互联网科技界的大牛和从业者,不吝赞美之词。
OpenAI创始成员安德烈·卡帕西(Andrej Karpathy)激动地在X平台发了篇“小作文”,感慨:“每个人都能成为多模式梦想的导演,就像《盗梦空间》中的建筑师一样。”
在微博上,专注于AIGC领域的博主@Simon_阿文认为,Pika 1.0在生成质量、编辑能力还是易用性方面,可能都拉到了当前技术的天花板级别。
而全世界最大的AI开源社区Hugging Face的CEO克莱门特(Clement)看完宣传片后认为:“2024年,某个主流媒体领域将会充斥AI生成的内容。”
同一天,Pika公开透露,已完成A轮融资,筹资总额达到5500万美元。瞅一眼投资者名单,堪称超级豪华全家桶,AI领域的知名公司可能都参与了。随便举几位个人投资者:OpenAI创始成员安德烈·卡帕西(Andrej Karpath)、Github前CEO纳特·弗里德曼(Nat Friedman)、Quora创始人亚当·迪安杰罗(Adam D'Angelo)……
创始人曾是浙江首个被哈佛本科提前录取的学生
据海外平台The Information消息,Pika成立于今年4月。创始人郭文景和联合创始人兼CTO Chenlin Meng,都是斯坦福大学AI Lab博士生。一位专注于NLP(自然语言处理)和图形学,另一位主攻计算机视觉方向(2020年在斯坦福大学获得数学本科学位),都有生成式AI的学术经历。
创始人郭文景(左)和联合创始人兼CTO Chenlin Meng
另据“海外独角兽”报道,郭文景曾透露公司还有一位创始人Karli Chen,“他是我的高中同学,高中信息竞赛获得过国家前十二名,是物理竞赛国际集训队成员,他主要做engineering方面的工作。”如此说来,Pika四人的创业团队,有两人来自杭二。
Pika的创建,还与另一家AI生成视频领域的明星公司Runway有关。郭文景和同学曾于去年参加Runway的首届AI电影节,奖金1万美元,结果作品没能获奖。而在创作的过程中,她认为Runway和Adobe Photoshop当时的AI工具并不算好用。
今年4月,郭文景决定从斯坦福退学,研发更好用的AI视频工具,于是便有了Pika。
如果你记性好,可能还记得8年前的12月,一则杭州高三女生被美国哈佛大学提前录取的新闻刷爆网络。
这位高三女生,正是郭文景。她出生于美国,在杭州长大,从小就接触编程,从本科开始留学,被哈佛大学提前录取。
这是杭二中第一个在本科阶段被哈佛大学录取的学生,也是浙江省第一个被哈佛本科提前录取的学生。当年她在面试的时候,计算机水平得到了哈佛大学中国秘书长汤玫婕的高度评价,“丝毫不输于美国同龄女程序员”。
郭文景在大二间隔年期间,成为Meta AI Research的全职员工,又先后在微软、谷歌大脑(Google Brain)、Epic Games等公司和团队实习。进入斯坦佛大学读博前,她已在哈佛大学取得计算机硕士和数学本科学位。
郭文景的母亲是MIT毕业的高材生,对于父亲,杭州人也不会陌生,浙江信雅达系统工程股份有限公司董事长郭华强。总部位于滨江的信雅达成立于1996年,是浙江首家在国内主板上市的软件公司,也是国内专业从事软件产品的研究开发、系统集成、运营服务的高科技企业。
1992年,郭华强等人创立杭州新利电子有限公司,研发中国第一代柜台交易系统,在中国金融史上写下了自己的名字。不过,对杭州来说,新利最大的贡献,是贡献了三家上市公司。在港股上市的新利本身外,核心团队出走后,孕育了两家大名鼎鼎的金融科技上市公司。
除了郭华强的信雅达,还有黄大成等人创立的恒生电子。2000年前后,中国的金融证券类软件90%的市场被新利、恒生和信雅达所占据。
说回Pika。今年7月,Pika在Discord推出服务器,截至目前用户已超50万,每周能生成数百万个视频。随着Pika 1.0火爆全球以及新的资金到位,Pika也开启了招聘计划,技术、产品、运营……预计明年会将团队扩充到20人。
郭文景透露,目前Pika的产品还是免费的,但最终可能会推出分层订阅模式,付费用户能享受更多功能。
AI视频生成迎来爆发期?
近半个月,除了Pika1.0,AI视频生成领域可谓动作频频。
11月16日,社交媒体巨头Meta发布工具Emu Video,能够基于文本和图像输入生成视频剪辑。
几乎前后脚,字节跳动的PixelDance模型来了。通过描述(纯文本)+首帧指导(图片)+尾帧指导(图片),即可生成包含复杂场景和动作的视频。
11月21日,Runway动态笔刷Motion Brush面世。在任意图片上抹一笔,就能变成一段动态视频,这让每个人都有了成为“神笔马良”的机会。
11月24日,AIGC领域的佼佼者Stable AI推出Stable Video Diffusion(稳定视频扩散模型),可以从图像中生成高品质的视频剪辑。
5天后,Pika 1.0发布。
在接受媒体采访时,郭文景这样解释AI生成图片和AI生成视频技术的区别:“视频有很多和图片不一样的问题,比如要确保流畅性、确保动作;视频比图像更大,需要更大的GPU内存。视频生成需要考虑逻辑问题,还要考虑如何生成,是一帧一帧还是一起生成。现在很多模型一起生成,生成的视频就很短。但如果要一帧一帧生成,又要怎么做?很多是图片生成不会面临的新的技术问题。”
AI生成视频的时长以及清晰度、流畅性,依然是她接下来想要突破的关键点。
那么,AI视频领域何时可以迎来自己的GPT时刻?郭文景希望是在明年。
也许用不了多久,个人轻松生成短视频的时代就真的到来了。
来源:都市快报