□ 本报记者 李凯
通讯员 陈正杰 王刚
“我们的AI配音平台有千万粉丝大V都在用,目前全球注册用户300多万,付费用户突破百万,业务营收同比大幅增长!”
南京经开区红枫科技园一家科技企业里,伴随着一群理工学霸敲击代码的声音,内容生成式AI应用正在静悄悄地爆发。
记者走访的这家企业名叫“出门问问”。打开公司旗下的AI配音平台“魔音工坊”,这里有千余种声音风格和强大的声音编辑功能,如同一个智能配音商店。用户可以用二十余种外语、方言配音,还能根据文字风格转换成抒情、悲伤、惊讶、悬疑等语气,同一种声音甚至还可以跨越性别、年龄,一键迁移音色。如果想用自己的声音演绎,用户只要录入20句话,即可定制高仿真声音,实现媲美真人的“克隆声”。
“这就是当下最热的AIGC,即利用人工智能技术来生成内容。早在2020年,我们就开始研发中文版大模型,同年推出首个商业化产品、业界Top级的配音平台——魔音工坊。”公司总经理潘曙光介绍,“魔音工坊”已与新浪、喜马拉雅、微信读书、大众汽车集团等知名海内外多媒体平台及企业达成合作,也是很多抖音、快手等用户首选配音工具。
在出门问问AI视频创作平台“奇妙元”,“数字人”形象多变、风格多元,有严肃认真的职场人,也有元气满满的少女,有灵动可爱的卡通萌妹,他们的声音千变万化,甚至用十多种外语进行24小时不间断播报和互动也不在话下。而这一切,只需要用户上传一段直播话术、一部手机或者电脑。
目前,这些“数字人”已在多个行业“上岗”,能用十多种外语进行7×24小时不间断播报和互动,可以轻松驾驭本地生活、生鲜百货、旅游推广、跨境电商等直播场景,也可以充当“数字人警察”、金融行业AI客服。最近,公司打造的斗鱼虚拟主播“甜妹小给给”,形象俏皮、性格爽朗,凭借实力超群的国风演唱出圈,直播在线人数峰值达到6万+,首月涨粉4万+。
在生成式文字和图片方面,出门问问还推出了AI写作平台“奇妙文”和AI图片生成平台“言之画”。前者可以一键生成高质量文案,还能对文字内容进行纠错与润色,上面还自带十余种语言翻译功能,用户可以轻松互译文字。后者只需要输入提示词,选择想要的画风,就能生成专属自己的绘画作品。
出门问问成立于2012年,是一家以交互式AI和生成式AI为核心布局的人工智能企业。公司创始人李志飞是前谷歌总部科学家、自然语言处理及人工智能专家,美国约翰斯·霍普金斯大学计算机系博士。他曾开发出风靡全球的谷歌手机离线翻译系统,归国创业出道即获红杉资本、真格基金等多家投资机构青睐,公司获评全球独角兽企业500强、江苏省独角兽企业。2020年,公司凭智能语音交互设备软硬件一体化关键技术及产业化应用技术,荣获中国智能科学技术最高奖——吴文俊人工智能科学技术奖(企业技术创新工程项目)。
强大研发实力加持,让出门问问在智能语音交互领域成为“元老级”存在。团队研发的语音助手最早应用在自家的TicWatch智能手表上,产品销量位居全球前列。超300万辆大众汽车的车载语音交互系统由出门问问提供技术支持。在公司进门处的液晶屏上,记者看到,全球地图上正实时显示着255万手表用户的在线状态和分布区域。
作为国内AIGC领域布局最全面的公司之一,出门问问于2020年签约落户南京,次年在南京经开区启用全国总部。潘曙光介绍,落户以来,公司在技术研发、市场拓展、项目申报等方面均取得很大突破,全面发展按下加速键。2022年,公司完整地推出了集图、文、声音和形象克隆等于一体的AIGC产品矩阵,且都已有明确的落地场景和商业化运作能力,构成“技术、产品、商业化”闭环,全球付费用户超百万。
如今的出门问问,无论用户量还是商业化落地规模,在中国AIGC领域都属于领头羊,不过公司还有个更大的目标——做中国自己的“大模型”。
“自主通用认知大模型,中国能做,也必须做。”李志飞表示,ChatGPT风靡全球,作为一种人工智能“大模型”被认为能在很大程度上改变人们的生产和生活。未来,出门问问将继续坚定深耕AIGC领域,把中国式创新的大模型越做越强,上层应用体验做得越来越好,同时把商业化做得更坚实,以平民化、更聪明的AI赋能千行百业。