当前位置:首页|资讯|AI绘画

4070 大战 3080Ti,AI生产力谁更强

作者:波导终结者发布时间:2023-06-14

大家好,我是波导终结者。

前阵子跟大家分享了4070跑AI生产力后,很多朋友感兴趣,都来咨询我装机方案,毕竟不是每个人预算都是无限的。小伙伴1号,公司主要业务是媒体相关,经常有大量的视频需要转码压缩,时间倒不是非常紧,但量大电费贵,希望有最高的能耗比;小伙伴2号,个人业余爱好是配音,已经在喜马拉雅有号,希望AI人声分离能搞定更多更好的背景音源;小伙伴3号,公司希望AI绘画能承担一部分的图片绘画原创工作,毕竟现在原画非常贵。 这几位对性价比,功耗,以及综合效率都有一定的要求。今天我就详细测试一下40系的显卡到底适不适合。


我自己工作室的两台电脑都是实打实的干活用,自认配置均衡,会比只用来评测的极端配置更贴合实际使用需求。机子1:10700K+Z490+3080Ti,系统WIN10最新,驱动Game Ready 531.41,机子2:12700K+Z690+4070,系统WIN11最新,驱动Studio。3080Ti是前两年公司业务刚需买的技嘉魔鹰,那时候算是高点了,24期到现在还在还,4070是前段时间入手的技嘉风魔,算是最基础的版本了。先抛开游戏,在生产力方面,4070真的已经碾压前代次旗舰了吗?直接来看。

单烤功耗


由于不同人对噪音的感知度不同(上次甚至有神仙说自己高于30分贝就会被吵得睡不着,emmmm),并且我没有专业的噪音仪(有人杠说民用千元以下和手机测都不准),盖不盖侧板,离得多近测也会对结果产生很大影响。所以我干脆不测噪音了,显卡满载还想个桃子的静音。先来看3080Ti跑甜甜圈,默认功耗墙是350W,我懒得去调,已经撞了,核心跑不满。


4070,功耗200W,也是没有跑满核心频率。不过某一方面满了之后,继续往上边际效应明显,不必纠结。我看不少朋友纠结烤机的时候哪个频率没满,大可不必。烤了一小时多的机,就稳定在这里了,后面的测试也均以单项目1小时为准。


另,软件显示的功率应该是从主板获得的,而主板是由内部电路测得的,理论上已经很准确。但为了防杠,我还特地使用了功率计佐以验证,软件与仪器基本一致,并未出现大的偏差。以上。

转码测试


刚才聊到频率的问题,是的,现在的显卡是一个很大的综合体,除了核心和显存外,还有编码解码,物理引擎,AI,光追等很多东西在里面,只要运行正常,就不必老想着频率跑满。比如这里,我使用4070来进行H264硬编码,可以看到,速度倍率在8.95倍,核心频率直接拉满到2790MHz,而此时的整卡功耗只有53.8瓦,基本上在52-55左右。编码的时候从GPU-Z里也能看到,Video Engine Load已经拉满到100%。最夸张的是,核心温度竟然不足50度,风扇根本不工作。我多次确认过,确实就是温度太低,风扇不转,活正常在干。


3080Ti这里,就差得有点多了。首先是速度只有7.61倍,功耗拉到了150W左右,风扇也以62%左右的速度在运转。最令我惊讶的还是速度,因为要用AV1编码,用的是最新版本的FFmpeg,也不知道是40系的第八代NVENC优化太好了,还是FFmpeg喜新厌旧,对旧显卡的优化已经不上心了?


总之,我把转码方面都跑了一遍,由于图片太多,看起来也乏味,这里直接整理成图表给大家看。可以看到,在3个项目的转码测试当中,4070的功耗都只有50多瓦,速度都接近了9倍速,最夸张的就是风扇从来没转过,核心频率拉满而核心温度始终低于50度。相较之下,3080Ti的两个项目的功耗在150瓦左右,速度只有6-7倍,风扇以60%左右的速度运转,核心和显存的温度也更高。


那么对于小伙伴1号来说,换4070确实是非常划算的,风扇不转,只有1/3的能耗,速度反而快了一半多。几十台机子长时间跑的话,电费很快就能挣回来。

PS:实际上3080Ti在10700K全核5G下跑,只有5.8倍左右,CPU软解占用直接来到了80%。由于我不太相信CUDA等账面参数将近翻倍的3080Ti比4070还要慢,实际上转码部分的测试我是把两张显卡都插12代这台上跑的,除了显卡所有其他条件全都一样。虽然成绩有所提高,但仍然是4070更快,此案终结。其他项目基本不怎么吃CPU,不再重复测试。

AI人声分离测试


因为软件、音视频这方面我比较精通,小伙伴2号同时还委托我测试一件事,就是UVR5直接从视频里扒,与将视频里的音频扒出来再处理,是否有差别。这里测试结果是:没差别。仍然使用我自己录制的H265,4K游戏视频实况,共1小时来测试,直接处理视频耗时5分07秒,处理纯音频耗时4分28秒。但因为手动把视频里的音频分离出来,也要半分钟左右,则可以认为分不分离音频都没关系,软件自动会处理。


另外,友情提示,UVR5仅是扒个50M的纯音频,也在某一步骤要吃掉12G以上的内存,所以干活用的朋友们,真的32G内存现在只是起步了。


从显卡的占用曲线可以看到,人声分离的处理是分步骤的,不像转码那么纯粹的可以吃满。3080Ti大部分情况下功耗在105-110瓦左右,偶尔飙上250W一小段时间,很快又回落。处理一个1小时的文件,平均功耗在122.13瓦左右。4070一样很夸张,风扇仍然不转,平均功耗41.7瓦。


太多的数据和截图仍然汇总成图表。UVR5对于内存的占用奇大,估计是模型需要载入内存吧,对于显存的占用,基本在5G以下,可以忽略,反正够用。这软件应该是比较依赖核心频率的,吃不满功耗墙,速度基本就看核心最高能飙到多少。但由于不是每个步骤都吃满,总耗时差别又不那么大。虽然领先没有那么大了,但不管从哪方面考虑,4070仍然都是更好的选择。

AI绘画测试


声明,本测试仍然使用默认模型,生成非真人内容。了解更多请移步评论区或其他地方。这里我让引擎生成N张猫吃甜甜圈的图片,可以看到挺有趣的,右边这张呃……好吧,猫猫虫和毛毛虫等同了。


监控GPU-Z图表可以看到stable diffusion的工作流程,一批一批的。3080Ti平时大部分时间功耗在190W左右,显存吃满12G,隔一段时间飙到350W满,显存释放一大半。因为软件的工作流程是每批生成N张图,生成M批,估计一次性太多会爆显存,所以分批次来了。


从图表和GPU-Z中可以看到,AI绘图时核心频率一直工作在很高但不满的水平,显存占用根据图片数量会越来越多,功耗大概有85%左右的时间只吃到一半出头,剩下的时间会周期性的飙满。鉴于4070的表现一样全面胜出,该选什么卡不用我说了吧。

AI语音转文字测试


既然测试了,那就干脆把之前搞的几个项目一起再试一遍吧。这里一样是跑Whisper,3080Ti平均功率在214.31W,大部分时间在211W左右浮动,有时候会飙得很高,但瞬间又软下来了。4070类似,只是各项功耗均低了不少。


AI语音转文字关于直接拿视频扒,以及分离音频之后再扒的结果,与人声分离类似,并不影响效率,可以放心直接处理视频,这里就不再赘述。这里我还有个想法,可能以后干活也用得着,就是把人声分离与语音转文字结合起来,就能排除背景音乐和其他干扰,把一个视频里的语言全部转换为文字了。

AI视频放大测试


话先说在前头,Topaz Video AI并不是简单的放大锐化,是依赖AI算法与模型补充细节的,所以速度很慢,目前每秒只有3帧左右。这里可以看到,显存占用并不大,但是核心频率一阵一阵的拉满。4070处理1小时下来,最低功耗33.6瓦,最高功耗140.4瓦,平均功耗71.74瓦。


看到这可能有的朋友要问,这些数据怎么来的呢?GPU-Z左下角的Log to file勾上,有完整的Excel,拉个公式就有啦。


因为速度太慢,效率就不提了。这东西目前属于可用,但极慢,需要等以后继续优化。而且值得一提的是,如上面的GPU-Z截图,4070实际上有1/3左右的时间风扇是不转的,但是图表很难表现出来,不折腾了,就提一嘴。


有的人可能会问我,为什么要那么在意温度,功耗,风扇和噪音呢?噪音这东西,风扇声肯定有,但我并不觉得吵,因为每个人感受不同,不好定义,反正这两张卡我都不觉得吵。功耗这东西,如果你自己交电费,或者家里、公司交电费的人会来找你麻烦,你就知道了。温度更不用说了,越低越好嘛,不少朋友要搞ITX之类的,性能和价格差不多的话,干嘛不要更安静温度更低的呢?


4070的游戏性能已经有很多测试了,在3080水平左右,比3080Ti还是差一截。而看账面数据,除了频率高一些以外,其他不少参数都“缩水”不少,比如4070配置有5888个CUDA核心,64个光栅单元、184个纹理单元,相较于3080Ti的10240个CUDA核心,112个光栅单元、320个纹理单元简直只有一半左右。但实际生产力表现上,4070却丝毫不虚。当然咱们可以说,因为一个是10700K一个是12700K平台不同,没有错,但真实的应用场景就是这样子的,我实际上干活就是10代配30系,12代配40系;转码项目我也挪到了同一平台上,仍然是4070全面胜出。而且正如UVR5那张任务管理器截图中所看到的那样,因为大部分项目跑的都是显卡加速,实际上CPU占用率并不高,根本不成为瓶颈。


最颠覆性的,还是新一代显卡超低的功耗和发热,以及很多时候风扇根本不转这件事,再加上整张显卡的长也只有300mm,很适合塞一些ITX之类的。这次618有小降一点,想玩玩各种AI的或者公司干活有需求的都是时候入手了。

感谢观看,喜欢的朋友帮忙点个赞和关注吧,我们下期再见。



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1