当前位置:首页|资讯|AIGC

美图公司陈剑毅:自研大模型出于实际需求和长期积累

作者:砍柴网发布时间:2023-07-17

原标题:美图公司陈剑毅:自研大模型出于实际需求和长期积累

科技蒙头狂奔时,一面造就出时代的企业,一面又在迭代浪潮到来时,将它们置于周期性“惶恐”之中。

始于2022的AIGC席卷之势,也一度令成立于2008年的美图置身漩涡。去年下半年,以Stable Diffusion为代表的AI绘画工具开源,“寒意”开始蔓延。美图创始人吴欣鸿曾如此拆分AI带来的机遇与挑战:机会不一定是我们的机会,但挑战是实实在在的挑战。

今年,是美图成立15周年。面对这场“危机”,他们没有选择凝视深渊,而是果断走向另一条“没日没夜地研究AI技术并进行测试”的道路。

上个月,在以“AI时代的影像生产力工具”为主题的第二届影像节上,美图一口气发布7款新品,包括AI视觉创作工具WHEE;AI口播视频工具开拍;桌面端AI视频编辑工具WinkStudio;主打AI商业设计的美图设计室2.0;AI数字人生成工具DreamAvatar;美图AI助手RoboNeo;美图视觉大模型MiracleVision(奇想智能)。

今年,美图的AIGC产品全面进入爆发期。但吴欣鸿曾透露过一个此前不太为外界关注的细节,“13年前,美图便已开始AI布局”——2010年,美图影像研究院(MT Lab)成立,聚焦计算机视觉;2013年,重点投入到深度学习;2016年,AIGC产品雏形“手绘自拍”出现。去年11月上线的AI绘画,一度令美图秀秀获得日本App Store总榜第一,美国总榜第二,多达二十几个国家总榜前十的好成绩。

在AI的驱动下,截至目前美图的全球VIP会员数猛增,从去年美图影像节公布的450万增长到截至719万。

“这半年,我们很多的团队都在研究AI,很多外部的合作未能及时反应,在这里跟合作方们说声抱歉。”彼时的发布会上,美图公司影像产业事业群总裁陈剑毅的开场白,是一句道歉,“我们对于AI可以用全情投入来形容。过去研发的很多功能,因为AI的到来,在这短短半年中迅速被实现,这是件非常令人兴奋的事情。”

面对这样一家“最擅长的事情是做工具”的公司,「明亮公司」于近期就相关新产品的进展及数据与大模型的关系等议题,独家对话陈剑毅,希望能够从一些侧面,展现“一家公司自研大模型的动力”,以及“拥有海量用户的公司在当下如何实现进化”等问题的答案。

以下为「明亮公司」与陈剑毅的对话内容(有删节)

Q:明亮公司

A:陈剑毅 美图公司影像产业事业群总裁

Q:此次公布的7款产品,截至目前已使用有一段时间,目前看来效果如何?

A:前不久,我们的美图设计室和华为云联合推出了“AI模特试衣”,另外还有更多的合作伙伴正在密切沟通中,根据我们内部的数据,美图设计室升级后推出的AIGC相关功能深受用户欢迎,呈明显上升趋势。

另一项影像节新品“开拍”的增长数据也很不错,已有超过1万名博主把“开拍”当做高质量、高效率的口播视频制作工具。我们也在接触一些相关领域的品牌,他们希望把开拍的AI提词器、AI剪辑等AI能力,通过API接入直播服务。

值得一提的是,为设计师提供服务的“WHEE”,目前已有超过2万名设计师加入其中,他们希望借助WHEE来提高视觉创作效率,这也是很多设计师最头疼的问题。

此外,我们的桌面端AI视频编辑工具WinkStudio、AI数字人生成工具DreamAvatar、美图AI助手RoboNeo也都在紧锣密鼓准备中,接下来会陆续上线,我们也会持续跟大家分享相关进展。

Q:你最中意哪款产品?原因是什么?目前对用户的效率提升是否有量化的统计?

A:对我们来说,美图影像节发布的7款产品都是美图AI产品生态不可或缺的一部分。

每个用户的内容生产方式、使用场景都是不同的,因此很难统计用户提升的效率值。但可以肯定的是,加入AI之后,生产效率一定大大提高,我们前期做过相应的调研,比如开拍,借助AI脚本、AI提词器、AI剪辑等功能,能在短短10分钟内,帮助你制作出一条高质量口播视频,这在之前是不可想象的。

Q:就功能而言,美图的新产品在实际使用中与其他类似产品相比,最核心的竞争力在哪里?

A:在我们看来,7款新品最核心的竞争力是“美学能力”和“解决问题”。

十五年来,美图公司的产品一直在美化人的真实形象,我们对用户的美学偏好是敏锐和准确的,不管我们做什么产品,都在美学上有比较高的追求,用产品说话,相信大家在使用我们产品的过程中可以感受到我们的能力。

另外,我们不会因为别人做所以跟着做,而是说切切实实发现了用户的需求和用户的痛点,所以我们的产品都是实实在在帮助用户解决问题的。

Q:存量的用户池,在促使新产品成熟方面有哪些重要作用?

A:美图公司拥有2.43亿的月活跃用户,用户基数庞大且使用黏性较高,我们从生活场景切入生产力场景,很显然,在用户启动层面,会比其它产品更加快捷方便。

另外,在新产品的筹备期,我们进行用户调研更方便触达。实际上,我们每一天都在根据用户反馈,进行产品上的更新和升级。

Q:就应用层面而言,以美图的规模,如今做自己的大模型是非常必要的吗,是否会投入太大?为什么?或者说,为什么不是先接入其他大模型用起来,再去研发自己的大模型,如此感觉可能会轻松一些。

A:我们自己做大模型,一个是基于实际需求,一个是基于长期积累的能力。市面上通用模型的效果有限,我们认为用别人的大模型,没有办法对效果提出意见和要求,比如说对方不支持高清画质,那我们就没有办法了。另外也有出于安全的考量。

Q:自有大模型研发最困难的地方在哪里?

A:大模型的效果要持续优化,需要不断地去进行调试,有点像匠人一样,不断去打磨细节,这个过程是很枯燥的。除了人力以外,也涉及到美学评估系统,需要不断告诉AI哪个好,哪个不好,以及用户喜欢什么样的,不断告诉它什么能做,什么不能做。

Q:上次发布会有提到,AIGC的到来令公司感觉身处“生死存亡之秋”。此后至今的半年,你和公司成员的状态是怎样的?

A:其实我当时只是想强调美图看到了机遇并且一定要抓住这个机遇。当然,我们不是口头说说的,面对这种历史性机遇,我们内部进行了快速调整,除了推动相应的组织变革,还快速将相关的培训、工具引入公司,让公司上下都对AI有更深入的理解和认知。

Q:就大模型本身而言,toC和toB有哪些不同之处?

A:我们并没有C端和B端的划分,我们的划分是生活场景和生产力场景,二者主要是落地场景和使用需求上的不同。面向生产力场景,我们为视觉创作、商业摄影、专业视频编辑、商业设计等垂直领域提供高效便捷的工具,实现降本增效;针对生活场景,我们持续为用户提供创意玩法,比如“AI绘画”、“百变AI头像”、“AI简笔画”、“AI动漫”等等都深受用户欢迎。

Q:我们现在大模型使用的底层技术是什么路线?

A:美图影像研究院自主研发,把公司长期积累的美学趋势研究融入视觉大模型,并搭建了基于机器学习的美学评估系统,为模型生成结果打上“美学分数”,从而不断地提升模型对美学的理解。此外,我们的视觉大模型具备独特的美学创作者生态,有艺术家、设计师等具有深厚美学背景的专业人士,共同参与到视觉大模型的建设中。

Q:为应对冲击,据说我们迅速在公司内部进行了人员调整,并引入相关生产力工具、进行培训等。突然地调整,相关员工是否能很好地适应?相关工具使用是否有顺滑地推进?

A:大家很适应,也很高兴看到大家都在主动进步,当然也感谢我们的PMO部门和人力部门,积极组织大家学习前沿领域知识,对于新型工具的引入也非常快速,现在我们内部很多同事都在用AI做事,并且已经形成了习惯。

Q:未来是否计划继续引入相关人才做补充?人才又从哪里来?

A:对于AI领域人才的引入,任何一家科技公司都会需要,这一点是毋庸置疑的,美图公司持续欢迎相关领域的人才。

我们AI领域人才的补充进展很快,我们会通过很多方式,把合适的人才请到公司来。另外我们还特意开启了相应的暑期实习和秋季校园招聘,与一些知名院校建立校企合作,2024年的校园招聘即将开启,欢迎大家留意我们的岗位。

Q:大模型的投入部分是否被归于公司整体研发投入中?迄今为止投入规模如何?

A:高研发投入是支撑美图持续创新的“压舱石”。2022年,美图公司研发投入达人民币5.86亿元,同比2021年增长7.5%。未来,美图将持续进行科技创新探索,结合用户需求持续研发。

Q:大模型建起来后,未来会计划拓展B端的业务吗?比如将其作为SaaS工具,开放接口给到需要类似服务的公司?

A:生产力场景在我们的计划当中,比如美图设计室2.0已经有开放接口的相关案例,目前也有主流电商平台、跨境电商平台、知名潮流电商和一些即将拓展AI业务的企业客户正在洽谈中。

这次影像节,大家只看到了我们发布的新产品,其实我们还有美图AI开放平台(Meitu AI Open Platform),依托美图强大的AI技术能力,持续为行业提供经市场验证的专业AI算法服务和解决方案,涵盖医疗美容、美妆门店、智能硬件、移动互联网等业务场景,目前已与诸多头部厂商、企业成功达成合作。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1