过去一年的全球科技界,没有比AIGC(AI-Generated Content)更热的热点。因为ChatGPT的一炮而红,这个以生成型预训练变换模型(Generative Pre-trained Transformer)为特点的AIGC浪潮席卷全球。根据Precedence Research统计,2022 年,全球AIGC市场规模为 107.9 亿美元。预计到2030年,这个市场规模将达到约 731.6 亿美元,复合增长率高达27%。
AIGC被看成人工智能领域的一次飞跃。燧原科技创始人兼COO张亚林先生日前在与半导体行业观察交流的时候指出,“文生文”和“文生图”是当前AIGC的主流应用,尤其是‘文生图’,因为其应用特点,已经具备了规模落地的潜力。
7月5日,燧原科技正式发布全新的‘文生图’MaaS平台服务产品——燧原曜图。在张亚林看来,推出这样一款产品是洞察人工智能产业趋势的重要决定。而在这背后,是燧原科技五年来的积淀和向人工智能新时代迈出前瞻性布局的关键一步。
AIGC风起,催生硬件新范式
正如大家在很多文章所看到的一样,人工智能拥有一段很漫长的历史。而之所以AIGC在近年来取得突破,海量的数据无疑是其基础,算法的进步也是AIGC快速发展的重要推动力之一。
据介绍,如ChatGPT这样的应用因为采用了先进的深度学习和自然语言处理算法,并通过大规模数据的训练和优化,呈现出人们看到的出色文本表现。算法的不断改进和优化,让AIGC能够更准确、更生动地生成内容,提供更好的用户体验。
与此同时,硬件的进步也对AIGC的快速发展起到了关键作用。
在过去,行业主流都是采用CPU去训练大型神经网络模型,其耗费的时间随着模型的增大与日俱增。到了2012年,Alex Krizhevsky使用Nvidia GPU在相当短的时间内成功训练出了深度卷积神经网络AlexNet,并大幅提升了图像分类识别领域的性能,开拓了GPU这类高性能处理器在人工智能应用的新时代。
张亚林表示,除了高性能处理器外,大容量存储器、高速网络连接部署以及大规模系统集群的发展,也为AIGC应用打下了硬件基础,使其拥有了强大的计算资源和存储能力,加速了模型的训练和推理速度,使得AIGC能够在实时性和性能上取得显著的突破。
但他同时也指出,现在的AIGC应用要训练1000亿甚至数千亿以上的参数,这就要求海量的算力,进而导致当前的单芯片设计难以满足未来的AIGC应用算力需求,于是在芯片领域,正在往Chiplet、2.5D/3D封装等方向发力,以提升芯片的性能。此外,无论是在芯片内部、芯片间,甚至是整个算力系统中,互联在AIGC硬件基础设施中扮演了越来越重要角色。
不过,正如他所说,这些互联并不简单地连接到一起,在此过程中还有很多的因素要考虑。因为从目前看来,在未来,用户会越来越面对一个更大量的算力池子。因此从顶层用户的角度看,如何能通过简单的编程模式、高抽象的编程模式去调动各个节点或者各个芯片的算力?如何有效地通过网络的方式或者是整体集群的方式把整个集群的算力有效利用起来?
具体而言,这就涉及两个关键要素:第一就是如何有效的把芯片通过互联结构把它连起来,形成一个有效的算力网络;第二就是如何让上面的编程者能够通过高测算的方式使用这个算力网络,最后达成模型的高效训练和推理,这是一个非常关键的问题。
“如何让开发者能够很轻松地利用这个算力,就变成一个关键。”张亚林总结说。
正是因为有了这样的转变,作为供应商,需要提供的不仅仅是芯片,而涵盖软硬件的一体化系统,尤其是伴随着“文生图”这类应用的商用,对供应商提出了新层次的考验。
“文生图”落地,平台提出新需求
“‘文生图’会是首个被大规模商用的AIGC应用。”在问及对AIGC未来的看法说,张亚林这样说。诚然,得益于Stable Diffusion的开源,众多开发者已经实际使用了这个令人眼前一亮的技术。
资料显示,Stable Diffusion是一个由CompVis、Stability AI和LAION等公司研发的一个文生图模型,它的模型和代码是开源的,而且训练数据LAION-5B也是开源的,其参数量也仅仅只有1B左右,这就让大部分人可以在普通的显卡上进行推理甚至精调模型,降低了“文生图”应用的入门门槛。
而从今年年初开始,Midjourney的强势来袭,加上微软和Adobe等竞争对手的入局探索,让整个“文生图”市场风起云涌。目前“文生图”已经在游戏、影视、设计行业等场景中开始落地。较“文生文”等应用的落地步伐更快一些。
张亚林介绍道,“文生图”的商业化模式首先是从游戏类开始的,因为在游戏类的产业里面会使用原来的游戏的风格化素材。在过去,这些都是通过原画师完成的,但现在借助等“文生图”应用,就可以生成比较好的各种原画风格图片。此外,文娱、影视渲染和美术设计也是“文生图”的发力方向。
“纵观当前的AIGC应用,唯‘文生图’在商业上有了说得通的逻辑,其训练模式和算法也比较成熟。从这个角度看,‘文生图’现在拼的是落地化。”张亚林说。他同时指出,当前大多数“文生图”开发者一般都是通过买云服务来构建其设计,但他们对云服务有很大的担忧,因为其很多东西都是私有化的。
为此,这些开发者期待的一种商业模式是一个私有化的集群——在本地进行部署,能够满足其文生图的私有化商业模式。当然,在这个平台内,还要集成算力云服务的组件、大模型和训练推理等一系列算法,再叠加一些服务,使平台化的东西具有一定的推广价值。
而要实现这些目标,就需要硬件提供商跟多个领域的合作伙伴建立合作关系。但据张亚林所说,这些合作会面临挑战:
01、第一,客户在文生图上的需求会日益变化,算法也会层出不穷。平台如何能够及时地纳入客户最新的对于算法调优的新需求,让不断更新迭代的版本跟合作伙伴一起能够提供给用户即时的升级要求,这是平台迎来的第一个挑战;
02、如何在降低自身软硬件成本的同时,和合作伙伴一起优化成本,让客户能够尝到性价比甜点。这在当前降本增效的主旋律以及激烈的市场竞争现状中,显得尤为重要。毕竟对于“文生图”这样的应用,一体化、高性价比、即时服务、可定制以及私有安全是其追逐的永恒目标。
基于这些见解,同时基于公司深厚的积累,燧原科技带来了“文生图”MaaS平台服务产品——曜图。
MaaS平台亮相,“曜图”如约而至
其实早就今年初,燧原科技就宣布了公司升级企业战略,那就是以全栈软硬件和集群产品为数字底座,结合MaaS(Model as a Service)的业务模式,全面打造人工智能技术生成内容(AIGC)时代的基础设施。
基于公司的实力和经验,燧原终于发布了AIGC浪潮下的第一款产品“燧原曜图”——一款高效易用,安全可靠、企业级的文生图MaaS平台服务产品,能为用户提供即时可用、创意无限的文本生成图像能力。
自创业之初,燧原科技就瞄准云端训练产品市场,以突破高难度训练芯片为目标,通过快速迭代提升产品的性能和能效。通过邃思系列芯片创新的片间高速互联,以及软件栈聚焦优化数据并行与模型并行等大规模集群的训练能力,奠定了今天燧原的训练产品在国内大规模集群训练场景上的优势。
对于“文生图”类应用,除了需要上述的高性能硬件外,在软件层面也要有的放矢。例如,我们不但需要打造从底层的软件栈到云服务的产品,还需要在其中集成各种模型库。同时,部署一整套软件的工具链也是刚性需求。因为只有这样的一套交钥匙方案,才是“文生图”私有化平台亟待的解决方案。这也正是燧原科技在软件上坚持的发展思路。
从三年前开始,燧原更是聚焦于以系统化的方式打造其软硬件系统,这让公司在推出相关方案的时候轻车熟路,如鱼得水。“只有一体化的软硬件解决方案,才能使客户真正的高效。”张亚林强调。
“曜图”正是燧原这种软硬件实力支持下的另一成功案例。
据了解,燧原曜图文生图应用充分针对当下行业现有文生图产品生态割裂和无法满足用户图像前处理与后处理需求痛点等问题,通过集成图像预处理、姿态建模、外部模型等一键导入能力,胜任多样化应用场景中的细分调优需求。而针对视觉创作领域专业术语海量且繁复的问题,曜图为用户提供prompt词典、大师经典作品prompt模板沉淀、逆向prompt等在内的全面prompt工具体系。
燧原科技已经拥有从硬件、软件到系统的全栈解决方案,结合云燧训练和推理产品在行业落地打磨的实践经验,可为客户提供丰富多样的人工智能系统软硬件产品,全方位降低AI算力中心部署和应用成本。而曜图的发布标志着面向AIGC领域的场景需求,公司可以提供基于原始创新本土算力的MaaS平台服务产品,持续为客户优化人工智能应用体验,在AGI时代更将引领技术生态合作发展。
走向多模态,最终目标
虽然首先从“文生图”落地,发布燧原曜图,但张亚林表示,燧原科技也在尝试其它领域的应用机会。“今年年底开始的大模型落地部署,对整个算力的部署,特别是对Fine-tune和Inference在商业部署方面的的需求会远远大于预训练。”张亚林指出。
他同时表示,目前的整个人工智能未来趋势一定是多模态的,能够把语言、文字、声音、图像、视频、3D这些通过转换,整合成为一个更大的统一模型,然后大家基于更大的统一模型,在上面调出更多的定制化的模型和行业模型再去落地,这就将是更聚焦和聚合的一个趋势。
于燧原而言,随着燧原曜图的诞生,公司将继续致力于以算力基础设施建设为基础,成为本土面向AIGC时代MaaS平台的推动者,立足行业技术创新前列的领导者,并针对日益复杂的人工智能应用场景需求,引领技术生态合作发展,为客户持续优化人工智能应用体验,推动数字经济发展。
在张亚林看来,AIGC至少是一个10年的大浪潮。作为一家算力在DNA中的企业,燧原科技将持续作为人工智能领域的专注者,继续加强算力的研发和创新,为AIGC提供更强大的算力支持。