当前位置:首页 > 装机升级 > CPU > 新闻
核心数与频率谁更重要?高频率与多核心不可兼得吗?
  • 2020/7/20 11:15:04
  • 类型:转载
  • 来源:
  • 网站编辑:shixi01
【电脑报在线】很多人看到现在的CPU市场,都会感叹AMD在相同的价位,往往会提供更多核心数,线程数的产品,而Intel往往是频率稍高,但同样的核心数往往比AMD更贵,Intel为何在核心数上处于劣势?

  这还是在核心间直接通信,没有明显的一致性和数据竞争需求,而在事务内存负载中,通过一个数据库常用的B-Tree索引算法,在执行中涉及并发的数据修改对内存一致性和准确性的要求,往往需要加锁,而加锁的粒度越大,则会更明显的影响并发性,其对系统的数据同步和数据一致性有较高要求,这必然涉及复杂的不同核心与其存储器之间的通信,随着核心数的增多,会变得越发不容易实现高并发,Intel在9代高端桌面处理器上支持TSX指令集,能大幅提高这类粗粒度锁算法的性能,但Cometlake-S没有支持TSX指令集,但这么一来,即使是与AMD R9 3900X 12核心处理器进行对比,10900K依旧在事务内存吞吐上优势非常明显,尽管这类高性能数据库需求对普通用户很少见,但也说明Intel处理器在苛刻条件下的适应能力

  (以上数据,数值越高越好)

  而在普通用户都熟知的内存延迟上,Intel处理器也的确控制得更好,不仅是内存控制器集成于CPU中的原因,也在于Intel自身设计的IMC效率好于AMD使用的新思IP方案。

  正是Intel处理器需要在核心数,频率,延迟,带宽,软件和用户实际需求中做出最大平衡,所以用户很难看到Intel在某一方面激进的提高,而是均衡发展,尽管如此,依旧有很多实际的困难没有被完全克服,但相比AMD来说,Intel在均衡发展上目前做的更好,尽管可能并不能绝对击败AMD更多核心的产品,但短板要小得多。

  比如在内存瓶颈极高的sisoftware科学分析测试中,同样遭遇了较大的挑战,部分项目开启超线程后成绩甚至会不如关闭超线程的情况(数据取相对最大值),在一般矩阵乘项目中,10900K最高在FP32上取得了50%的领先,在FP64上取得了32.5%的领先,而3900X 12核取得的最大优势在N体模拟FP64项目中,为28%,相对来说,可见3900X的大缓存也起到了一定作用,但在内存资源瓶颈的情况下Intel的表现显得短板要小一些。npack代表测量求解线性方程组的执行速率的测试,是非常著名的高性能稠密矩阵相关算法的基准测试,其中完成矩阵乘的部分随着矩阵规模提高,内存带宽需求也不断提高,以保证矩阵数据顺利进入缓存保证CPU核心计算,通过AVX256 FMA指令完成GEMM计算,不同分块的矩阵计算过程中需要广播通信,(vbroadcast指令),Intel处理器执行AVX256 FMA计算每周期理论可以发射两个256FMA指令并并行一个broadcast指令,而AMD Zen2架构如果并行2个256FMA指令则无法同时发射一个broadcast指令,同时双通道内存的带宽瓶颈也在不断凸显,可见核心数量并不是简单的增加就能提高运算能力,多核加速比在10核以上尺度已经遇到瓶颈,10900K和3900X相比各自的8核小兄弟,小于核心数量的提升幅度,但10900K依然保持了最高效的速度。

  (以上数据,数值越大越好)

  缓存敏感,多线程并行困难项目:

  而最终,在多方面稳步前进的谨慎设计下,不仅在密集计算中Intel短板更少,在苛刻环境下表现更佳,在我们日常使用和游戏中也有更好的表现,如果说日常程序中感知不强的话,在我们常见的网络游戏中,由于游戏中对CPU的更多体现在短时响应需求和游戏数据转发路由等对延迟敏感且难以并行的负载,对单核性能要求较大,所以10900K的表现非常抢眼,i5-10400使用默认2666内存相比3900X也相差不大

  (以上数据,数值越大越好)

  在3A大型游戏中,往往游戏还会对实际快速建模的渲染与快速响应,游戏中AI寻路等负载综合运行,对CPU有更复杂的要求,但GPU瓶颈相对较高,有时CPU到达一定性能程度后,往往就不再是瓶颈,所以有的3A大作不同CPU的表现会很接近,但这不绝对代表CPU就没有影响,即使在3A大作高特效的情况下,10900K同样一骑绝尘,10400表现也足够出色,足够与3900X媲美甚至反超。

  (以上数据,数值越大越好)

  总结

  所以,尽管Intel处理器往往核心数增加的并不激进,但提高性能的方法很多,我们实际使用的情况下,也非常复杂,不是简单堆砌执行单元,核心,或者其他某一个参数就能解决的,需要综合全面的发展,才能确保用户在各项使用中获得最好的体验,尤其是i9-10900K,集合了高效率的微架构,超高的频率,合适的延迟和合适与主流双通道内存带宽的核心数,是一款性能出色且没有什么短板的高性能处理器首选,虽然并不能说完全可以克服核心数量与缓存,内存性能以及程序本身的多核扩展带来的瓶颈,但在大多时候能更好的适合各类家用负载,就算使用场景的性能因素较为复杂,实际使用也都能相对的得心应手,兼顾核心与频率,更能兼顾更多细节,更好的完成处理任务。

  不仅仅如此,更在面对内存瓶颈时,有更高的内存超频能力,Intel平台能在不牺牲缓存和内存控制器性能的情况下将内存频率提高到4000Mhz以上甚至更高,这样就能带来更高的内存带宽和更低的延迟,而AMD平台要想达到4000Mhz+以上的内存频率。需要将IF总线频率放宽到内存频率一半的模式,这样实际内存控制器到L3的IF总线频率反而下降,连带这部分的带宽和延迟性能也受损,带宽提升极为有限而延迟更高,AMD官方数据也证明了这点。

  所以AMD的多核处理器在面对内存瓶颈时,也少了一个应对办法,所以Intel平台相对AMD平台依旧有诸多领先之处,也更能为用户和玩家创造更多可玩性和性能解决方案。

我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交