写在开头
今年是AIGC火爆的一年,以AI为主导的生成式内容层出不穷,ChatGPT、AI画图、各式各样的大模型落地,每一样都给我们带来颠覆性的改变。显卡不仅可以用来玩游戏,还可以“炼丹”。不过在AI方面赚得盆满钵满的还要属NVIDIA,这也导致好多玩家以为只有N卡才能支持Stable Diffusion这类AI应用。
事实上并非如此,我们熟悉的英特尔其实也一直致力于AI领域,多年前就已经布局,研发投入力度不亚于NVIDIA。像前段时间上市的酷睿14代处理器,旗舰级的i9-14900K甚至可以通过AI进行超频,频率直接突破6.0GHz以上,带来极致的性能体验。
即将面世的Meteor Lake处理器,甚至还首次引入了AI单元,这也是英特尔首次在CPU中放入独立的AI硬件单元,这样意味着你甚至可以不用独显,就能感受到AIGC的魅力,这对使用英特尔处理器的笔记本用户绝对是一大福音。
硬件选择
说了那么多,相信你也迫不及待想要看看英特尔的AI应用了吧。不过在这之前,依照惯例,还是介绍一下我们使用的硬件平台。首先是CPU,我们选择了酷睿i5-13600K处理器,这是一颗14核心20线程的处理器,采用了6P+8E的混合核心架构,与最新的i5-14600K仅在最高睿频上有所差距。
i5-13600K处理器睿频频率最高可达到5.1GHz,其中P核的基础频率为3.5Ghz,睿频频率为5.1Ghz;E核的基础频率为2.6Ghz,睿频频率为3.5Ghz。并且处理器缓存部分搭载了24MBIntelSmart Cache和20MB二级高速缓存。这个配置放在现在,都是极具性价比的游戏神U。
GPU则是我们熟悉的ARC A750显卡,搭载ACM-G10核心,不过稍有阉割,基于TSMC 6nm制造工艺,内置28个Xe-Core引擎,28个光线追踪单元,448个XMX引擎,以及448个XVE矢量引擎等,核心基础频率为2.05GHz。
其他方面,这款ARC A750为基于英特尔Xe HPG微架构打造而成,内置英特尔XMX AI加速引擎,专为DirectX 12 Ultimate优化的图形管线,专为加速当前和未来内容创作所需工作负载的全新Xe媒体引擎,支持DisplayPort 2.0定义的UHBR10的Xe显示引擎,以及支持英特尔Deep Link技术。
并且作为一款主流级的产品,ARC A750配备的是8GB GDDR6显存,显存位宽为256Bit,显存带宽512 GB/s,大显存的加入明显是为了内容创作者和游戏玩家准备的,也正因为有大显存大位宽,让这款显卡的AI能力有了新的可能。
驱动则是目前的最新版31.0.101.4953(当你看到这篇文章时,英特尔估计又更新新驱动了,毕竟英特尔对ARC独显是真的上心,基本每周都会有一个新版本的Beta测试驱动与大家见面)。
其他硬件选择如下所示。
英特尔大语言模型体验
ChatGPT、NewBing、文心一言等大模型的崛起,让更多的玩家得以摸到AIGC的门槛,不过由于众所周知的原因,在线的大模型往往有很多限制,敏感词不能用、响应速度慢等。如果有一个本地运行的大模型就好了,这样就可以“为所欲为”了。
为了让更多的玩家能够体验大语言模型带来的便利,英特尔提供了可以离线运行的大语言模型应用的算力并实时优化,它专门针对低比特量化设计,支持 INT3、INT4、INT5、INT8 等各种低比特数据精度,性能更好,内存占用也更少,即便是核显来了也能用!
打开后,左侧可以选择聊天内容、调整模型参数和查看运算延迟,右侧则是聊天框。英特尔大语言模型应用拥有“聊天助手”、“情感分析”、“中文翻译”、“故事创作”、“生成大纲”、“信息提取”、“美食指南”、“旅游规划”等八大模块,并且还有写代码的能力。
首先我们让这个AI给我们介绍一下广州有哪些美食,这款大模型的回答很是出色,而且回答这么长的一段话响应速度也很快,只用了42ms 就完成了响应。
同样的问题我们也问了文心一言,不过文心一言的响应就比较慢了,没办法做到想本地大语言模型一样秒问秒答,并且英特尔大语言模型还给出了每款美食的制作办法,这点上比文心一言还要细致!
接着我们加大难度,来到旅游规划选项,让AI帮我们规划一次上海之旅。大模型的生成结果同样能够让人满意,把上海最主要值得去的景点都列了出来,跟着这份指南去游玩不会有什么问题。
再看看文心一言的回答,两者的答案基本一致,不过英特尔大语言模型生成同样的内容仅需42ms,遥遥领先于在线的大模型。
挑战更高难度的操作,让这个大语言模型帮我生成一部科幻小说大纲,它同样很快就列出了一套逻辑清晰完整,内容详尽的大纲出来。这确实是一个非常实用的功能,尤其是当它能够在终端侧离线运行后,对工作大有帮助。比如说老师、学生等群体,在没有网络的情况下,也能利用 AI 辅助,非常方便。
同时我们观察一下运算过程中的硬件占用,ARC A750的占用率其实不高,甚至显存也没有占用多少,不到1GB。并且即便是这样低占用的情况下,离线生成超长的大纲也仅需988ms,这个成绩真的相当出色了,别说是独显了,就算是核显来了,也能轻松胜任!看来英特尔的算力对AIGC的支持有点东西。
从体验上来说英特尔大语言模型应用还是相当不错的,它在响应速度和答案的靠谱性方面,和我们平时使用那些云端大模型产品几乎没太大差别,有些时候响应速度甚至更快,因为云端大模型在高峰期网络拥堵的时候,还会出现响应缓慢甚至生成失败需要重新生成的情况,但可以离线使用的英特尔本地大模型就不会出现这种情况。
不过它还是有些问题存在的,毕竟因为离线运行的特性,在触及一些比较新的内容时,就会出现错误。但是将它当做是你平时工作的辅助工具,它还是完全能够胜任的,并且以英特尔的实力,未来继续优化完善,这个离线大模型的能力还有望再进一步!
Stable Diffusion with OpenVINO画图测试
玩转基础的AIGC,让AI陪你聊聊天,总结一下文档,上面的英特尔大语言模型就能轻松满足你的需求,但是如果你想要AI画图,那这个计算量恐怕就得上独立显卡了。不过一说到AI画图,大多数玩家第一反应那都是N卡。其实早在今年5月的时候,英特尔就展示过基于OpenVINO的AI绘图开源模型Stable Diffusion,它可以使用开源图片编辑软件GIMP,在英特尔ARC A750、A770等显卡上流畅运行,通过输入简单的文字,仅需很短的时间变可以实现创意绘图,帮助用户提升效率。
现在基于OpenVINO PyTorch后端的方案,不仅能够让英特尔的独显,甚至是处理器、核显都用上Stable Diffusion,并且顺利运行FP16精度的模型,我们熟悉的文字生成图片、图片生成图片以及局部修复等功能都有不错的使用体验。
下面我们就实际看看,英特尔的锐炫显卡在AI画图上的表现如何?我们使用ARC A750生成一张512x512的图片,可以有独显的介入后,效率相当高,仅用时2.4秒就完成了,并且图片质量相当高。并且显存占用仅有4.4GB左右,可见8GB的显卡也能轻松玩转AIGC!
紧接着我们也试了生成更大分辨率的图片,将分辨率调至768x768,在使用ARC A750的情况下,用时约7.4秒,期间显存的占用为6GB左右,并未占满全部的8GB显存。并且功耗也是出奇的低,不到40W,可以说真的是相当节能了。
如果你想生成更大尺寸的照片,可以试试软件内的附加功能,它可以直接将512x512的图片放大至任何你想要的分辨率,实测将512x512的图片放大至1024x1024也仅需6.2秒。
总的来说,如果你对AI画图有更高级的需求,像大批量出图、专业模型微调等,那一张独显是必不可少的。从上面你也可看出来了,ARC A750的出图速度仅需2秒多,这个速度就算跟N卡相比,那也是丝毫不虚。根据Tom's Hardware的测试,它的表现甚至已经能够跟RTX 4060掰掰手腕了,在硬件规格上ARC A750是肯定不如RTX 4060的,而AI性能的领先应该要得益于英特尔在软件层面的持续优化。
小白也能AIGC——绘世启动!
上面提到的英特尔基于OpenVINO的方案能够让你迈入Stable Diffusion的门槛,但是它还是有一些缺陷。不过好消息是,现在英特尔的ARC独显已经适配了Stable Diffusion 绘世启动器,可以做到一键部署、一键启动。
话不多说,我们这就绘世,启动!
在生成引擎处可以看到,这里的ARC A750支持DML后端以及英特尔主推的Pytorch的IPEX后端,后者在兼容性以及性能上都要远强于DML。
使用绘世启动器的好处还有,你不再需要到处去找模型,也不用苦苦纠结模型应该放在哪个文件夹。在绘世启动器中可以直接搜索下载,并且这些模型还使用了国内的镜像,下载速度更快速。
除此之外,在绘世的工具箱中还能找到一些常用的资源网站,如果你对AI画图有浓厚的兴趣,那绝对不能错过!
实测一张512x512分辨率的图片生成需要4.5秒,很难相信吧!没想到英特尔的显卡也能做到这个地步,跟N卡不相上下,比起A卡,那更是遥遥领先。
再画一个二次元小姐姐,效率依旧很给力,4.6秒就出图了,跟上面的真人小姐姐不相上下,显存占用更是低得惊人,只有2.8GB。
换用绘世启动器后,最大的变化就是高清修复的算法得到了质的飞跃。我们还是按照上面OpenVINO里的参数设置,将刚刚生成的这张512x512的图片放大至1024x1024,沿用RealESRGAN 4x+Anime6B算法,实际用时只需9.69s的时间!不过显存的占用还是很明显的,从原来的2.8G直接暴涨到6GB以上。
放大后我们看看效果,单从图片质量上看,不得不说ARC A750真的很出色了,能用如此短的时间就生成一张可用的图片,并且相比起在OpenVINO中的,它的效率更是翻天覆地的变化。
当然,在绘世启动器中你还可以更方便的使用扩展功能,例如LoRa,LoRa是一种基于深度学习的AI绘画算法,利用计算机视觉与图像处理的技术,能够自动生成逼真的绘画作品。LoRa项目致力于通过训练神经网络模型,使其能够模仿艺术家的绘画风格,并生成具有相似风格的绘画作品。
在加入LoRa模型后,即便是生成一张1080x1080的二次元风格图片,也只需要12秒多的时间,如果你只是想要一张512x512的图片做头像,那这个生成时间还能更短。值得注意的是,此时ARC A750虽然是一张8GB的显存的显卡,依旧足够玩转AI,像这张图的生成过程中只用了6.3GB,而显卡功耗更是低至35W。
其他性能表现
光看AI可不够,精心打造的平台不仅要能畅享AIGC,还要有生产力才行。通过CPU-Z可以看到这颗14核20线程的i5-13600K表现相当出色,处理器的基准测试分数,单核心为802、多线程为9481,多线程倍率为11.81。
在3DMark的CPU Profile测试中,成绩也十分给力。单线程1104分,而最大线程可以去到10326分,并且测试全程,这颗i5-13600K基本能够稳定在5GHz左右。
不错的得分让这款处理器能够很好的应付渲染工作,在最新的CineBench 2024中测试,处理器的单核为115pts、多核为1296pts,MP Ratio为11.26x。
SPECworkstation 3.1则可以考研处理器应对图片处理的性能,实测结果来看,i5-13600K平台还是表现出很不错的效果。
i5-13600K同样凭借自身核心高频及多线程所带来的性能优势,在数据交互有很好的呈现。如7-Zip中,压缩速度为111000KB/s、解压缩速度为1449290KB/s,CPU使用率为1516%。
内存测试则是直接拉满,7200MHz启动!读取、写入与复制的成绩都突破90000MB/s,差点就能越过100GB/s大关。
再整体看看这个平台的性能表现,在3DMark的Time Spy测试中ARC A750得分约为12673分,i5-13600K则是。Fire Strike中ARC A750可以跑到31437分,CPU得分。你可能对这个成绩没什么概念,ARC A750的性能表现远超竞品RTX 3060,部分性能甚至超越了RTX 3060 Ti!而i5-13600K也能够让你在1080P甚至2K分辨率下畅享诸多3A大作。
生产力方面,这套i5-13600K+ARC A750的平台也是丝毫不虚,最基础的办公Office Productivity测试,总分有7247分,视频编辑的测试也名列前茅,得分8137。
修图、剪辑等更具压力的应用也遥遥领先,ARC A750的表现可圈可点。总的来说,这套平台的性能表现相当稳定且出色,而且在细分项目中,平台所能呈现的处理能力与反应回馈速度都达到一个高效快速的水平。
另外值得一提的是,ARC A750还可以加速内容创作,作为首款支持AV1编码的GPU来说,称它为内容创作神器也不为过。使用一段8K片源与工程文件分别测试AV1格式和H.265格式下的编码时间和文件大小。采用AV1硬件加速编解码功能时,时间比H.265稍稍快了一些。
并且AV1编码的视频文件占用也更具优势,无论是4K分辨率还是8K分辨率,使用AV1编码后,文件整体大小能够降低一些。并且英特尔的工程师还说过“视频码率越大、文件越大,越能体现AV1硬件加速编解码的加速效果”,妥妥的创作利器。
至于工业软件方面,我们也是测了SPEC 2020,ARC A750在部分项目中的表现可谓相当夸张。如果要对比竞品,那性能将是RTX 3060的4倍左右。虽然ARC A750的开山之作,但它的实力可不容小觑。
最后再给大家展示一下整体平台的综合性能,CrossMark测试能够很好的反应平台的生产率、创造性以及反应能力。实测这套平台在生产率、创造性、反应能力分别得分1934、2407、1815,总体能够取得2105分。这个表现,可以说无论是游戏体验、视频创作、工业生产、亦或者是AIGC,它都能手拿把掐,满足你的各种需求。
总结
英特尔自从推出ARC锐炫显卡以来,驱动更新一直没有停过。在首发时,实际体验可能还不够完美,但在经过一年时间的沉淀下,我们手上的这款ARC A750无论是游戏性能还是视频编解码都有了质的飞跃,甚至于能够跟RTX 3060 Ti掰掰手腕,属于是越级体验了。
再看我们今天的测试重点,英特尔在AIGC上的努力也是有目共睹,首先就是英特尔自己研发出来的OpenVINO方案,让AI不再是N卡的专属,实测下来,即便是跑SD 1.5的模型也相当迅速,出图质量也不错。再到绘世启动器的整合包,一键部署一键启动的傻瓜式操作,让小白用户也能轻松上手,对主流模型的支持与扩展性也相当齐全,相比起OpenVINO的入门能用,整合包突出的就是一个简单好用!
总的来说,现在选购一张ARC A750还是相当有性价比的,面对竞品RTX 3050或RX 6600,它不仅有更大的显存与位宽能够支持AIGC,还有着更低的售价以及无矿卡的风险。并且英在特尔积极更新驱动下,这张显卡的性能还在上升!优异的生产性能与AI表现,外加1500元不到的售价,完全就是主流玩家高性价比的绝佳选择!
本文所有测试软件均为实际使用、真实测试,不代表任何品牌方立场。