AMD新核显性能媲美4070！APU将成AI PC主流方案？

2024-11-18 15:24:29卓越科技

很长一段时间里，人们对于CPU核显的性能，都还停留在「能用」的阶段，不过苹果的M系列芯片核显却颠覆这一认知，让大家意识到核显的性能其实也有很大的进步空间。

在核显领域，强大的并不只有苹果，在独显市场被英伟达打得满地找牙的AMD，前段时间就曝光了目前最强的x86架构核显，并将会搭载于未来发布的Radeon8000S系列上。

图源：推特

作为x86生态的一员，AMD的核显在泛用性上无疑是远远超越苹果的，而且从目前曝光的信息来看，其性能更是一个大“惊喜”。AMD核显大战独显，底气何在？

近日曝光的AMD新核显，其芯片代号已经基本确定，并非沿用此前的Radeon800M/900M，而是直接更名为Radeon8060S和Radeon8050S。新的命名方式与AMD积极发布的下一代RX独立显卡保持一致，换言之所采用的核心与AMD的独显大概率是同款。

虽然此前AMD也尝试过将独显核心部署到CPU里，但是受限于工艺制程，并没有取得很好的效果，所以后续还是单开一个序列，只是沿用了独显的同款GPU架构。不过，即使并非同款核心，出色架构设计带来的性能提升也让AMD的APU（AMD对拥有高性能核显单元的CPU的称呼）成为x86最强。

而在台积电的3nm制程成熟后，加上DDR5内存的成熟以及CAMM2内存标准的正式确定，AMD也终于找到了进一步提升核显性能的机会。从曝光的信息来看，Radeon8060S/8050S将分别拥有40/32个CU单元，其中Radeon8060S的单元数与苹果的M4Max一致，其实际性能或将接近移动版的RTX4070。

图源：微博

如果曝光信息无误，那么这将会是核显性能首次能够与高端独立显卡角力，要知道上一代核显的实际性能只是刚好超过GTX1650的水平（英伟达在2019年发布的入门级独显），而RTX4070则是英伟达2023年发布的高端显卡，如果按综合测试的基准成绩来算，RTX4070的性能约等于GTX1650的3.8倍。

如此大的提升是怎么做到的？很简单，看看CU单元数量就知道了，Radeon890M的CU单元数量只有16个，而Radeon8060S则是40个，是前者的2.5倍，即使其他参数不做调整，性能也将是前者的两倍以上。

而且，搭载Radeon8060S的锐龙AIMAX300系列将会采用chiplet分离式设计，简单来说将GPU芯片与CPU芯片分开封装并彼此独立。因此可以在CPU里塞进超大规模的GPU核心，甚至从曝光的内部设计图来看，GPU核心的面积要明显大于CPU核心。

另外，chiplet分离式设计还可以让AMD将HBM3内存集成到芯片内，作为GPU核心的独立显存使用，解决主板内存带宽和速度无法满足GPU性能释放的问题。正是因为有望解决了GPU核心以及显存带宽问题，才让新一代核显在性能上出现了惊人的突破。

核显性能媲美高端独显，或许真的不只是说说而已了。AI时代，核显成芯片巨头必争之地

为什么AMD要执着于将高性能的GPU塞进CPU里？以前主要是为了押注入门娱乐PC的赛道，只需要购买一个比同规格CPU贵一点的APU，你就可以得到一个高性能CPU+入门级独显性能的核显，能够满足网游及部分单机游戏的娱乐需求，而且因为不需要考虑显卡的安装，可以做成盒子大小的迷你主机，便于部署和摆放。

但是随着AI大模型的出现，APU的用途就悄然发生了变化，核显的用途不再是视频编解码加速和游戏，而是成为AI算力的一部分。虽然现在的CPU大多将NPU作为主要的AI算力来源，但是GPU在并行计算和高计算量任务方面的优势是无可替代的。

举个例子，AI大模型中非常热门的文生图功能，在部分AIPC上已经实现了端侧运行，但是实际效果并不好，往往只能生成构图简单且小尺寸的图像。这是因为NPU虽然在AI运算上非常高效，但是却不具备GPU的超强并行计算性能，难以进行复杂的非线性操作和深层次的模型计算。

实际上，NPU和GPU在文生图等功能上是可以互补的，利用NPU的高效推理分析和理解用户需求，同时生成简单的图像框架，再用GPU来执行更深层次的优化并丰富画面，最大程度地利用各计算模块的优势，就可以提供更高效的AI服务。

未来的AI功能想要在图像分析、生成、修改等方面进行更深层次的功能探索，那么GPU就是必需的，因为其本身的性能特点是无可替代的。而且，不要觉得这些功能离你还很遥远，就以我们常用的AdobePhotoshop来说，新版本已经支持大量AI功能，并且提供本地端侧的AI功能支持。

图源：Adobe

而在实际测试中，虽然没有独立显卡的PC也可以运行端侧AI功能，但是却有大量功能被限制，即使是可用的功能效率也大打折扣。所以，Adobe建议用户搭配至少拥有4GB显存的GPU，以此来保证端侧AI功能的基础功能都可以启用。

随着Adobe在旗下软件中普及AI功能，轻薄本的核显性能已经无法满足需求，除非你只打算使用Adobe套件的基础功能，否则一个性能过得去的GPU就是必需的，不管它是独显还是核显。

Adobe只是整个AI生态的其中一部分，未来的AIPC显然不会止步于此。AIPC爆发，APU核显将成为主流方案？

那么问题来了，为什么一定要核显？CPU+独显的组合难道不行吗？并非如此，APU和CPU+独显都是未来AIPC的方向，但是侧重点却有所不同。CPU+独立显卡，也就是现在的高性能笔记本电脑，虽然性能强大但是因为需要应付两个热源，所以对散热系统要求更高，无法做到真正的轻薄设计。

但是APU不同，因为CPU、GPU等都被封装到一个芯片里，可以通过均热板等技术更好地优化散热系统，在保持散热系统轻量化的同时满足散热需求，更好地满足移动办公需求。

换言之，APU能够满足AIPC的移动化和随时部署要求，虽然在性能峰值等方面肯定无法与CPU+独显的组合相比，但是却可以更好地部署在小型PC、移动PC里。当然，一个高性能的APU本身功耗肯定不会低，届时就只能看CPU厂商如何进行取舍了。

此外，APU可以利用统一内存等技术，让CPU、GPU共用高速内存，虽然成本会显著上升，但是也可以提供更高的性能，并且满足大型AI模型的运行要求。比如苹果的Mac就利用超大统一内存的优势，能够流畅运行RTX4090都无法流畅运行的AI模型，不管是AI开发还是AI应用，都有着更显著的优势。

图源：极客湾

实际上，CPU+GPU的组合芯片已经被多个半导体巨头盯上，除了前面提到的苹果和AMD外，英特尔、英伟达也在探索这个市场，英特尔的Xe-LPG就采用了独显同等核心，只是性能与AMD还有很大差距，仅相当于780M的水平。至于英伟达，则是更激进一些，选择直接将CPU内置到GPU里，反其道而行之。

其实英伟达的思路也是可以理解的，既然自家的优势在于GPU而非CPU，那么将GPU打包为主要卖点，CPU作为附赠功能来销售就可以更好地发挥出英伟达的技术优势，只是对于PC市场来说这样的组合确实很新鲜。

核显赛道以前是英特尔独秀，后来AMD加入战场，现在则是进入三国争霸的阶段，英特尔、AMD、英伟达都想在这个市场上取得优势，因为这将关系到未来的AIPC市场走向。苹果呢？作为四大主流芯片平台里唯一的封闭式生态，苹果虽然并不直接参与竞争，但是却已经成为其余三家无法忽视的对手。

未来，随着苹果逐渐完善自己的系统生态，Mac设备的市场份额会不可阻挡的上升，虽然因为价格等问题并不会直接威胁到x86PC的核心地位，但是却会蚕食掉相当一部分移动PC和AIPC市场。

谁能想到，曾经毫不起眼，被视为CPU附赠品的核显，会有一天成为兵家必争之地。

APP下载