【电脑报在线】【文章摘要】年前,通过Intel提供的硬件底层精密测量方法,我们看到了Atom Z2760相比于Tegra 3的巨大功耗优势。虽然数据是可靠的,但和很多读者一样我们也感到不满足,毕竟Atom在工艺上更新一些(32nm VS. 40nm),而且对比其它移动处理器又会怎样呢?
年前,通过Intel提供的硬件底层精密测量方法,我们看到了AtomZ2760相比于Tegra3的巨大功耗优势。虽然数据是可靠的,但和很多读者一样我们也感到不满足,毕竟Atom在工艺上更新一些(32nmVS.40nm),而且对比其它移动处理器又会怎样呢?
经过一番努力,
AnandTech又从Intel那里拿到了另外两款平板机:
戴尔XPS10,配备
高通S4APQ8060A,28nm工艺,
KraitCPU架构双核,主频1.5GHz,Adreno225GPU图形核心,操作系统WindowsRT;
GoogleNexus10,配备
三星Exynos5250,32nm工艺,
Cortex-A15CPU架构双核,主频1.7GHz,Mali-T604GPU图形核心,操作系统Android4.2。它们都是当下新工艺的产物,32nmAtom不再有额外优势了。
XPS10的改造要困难一些,因为宏碁W510、微软SurfaceRT里为CPU模块供电的电路上都只有一个电感,而
高通的多核心CPU都为每个核心使用了单独的频率和电压层,APQ8060A的两个核心就有各自的供电电路和电感。 
测试中在每个电路中都串联接入一个20毫欧姆的电阻(上图中两个橙色标识),
所得的功耗值就是二者的叠加。黄色标识对应的是GPU测量电阻。
这还不算完。
高通的Krait架构中二级缓存也有独立的频率和电压层,APQ8060ACPU频率最高1.5GHz的时候二级缓存最高则是1.3GHz,不幸的是,二级缓存供电电路无从寻找,所以
以下数据中APQ8060ACPU功耗是不包含二级缓存部分的,平台功耗自然包含。 下边通过两个例子看看高通这种异步核心的实际功耗表现。

SunSpider这种多核心负载不均匀的项目中,第一个核心全速运行,第二个的速度则慢很多,但也没有完全休息。如果两个核心捆绑在相同的频率和电压上,第二个核心自然就会浪费不少资源。当然,这需要超快的微控制器来掌管切换。

Kraken又是另一回事儿了,两个核心的负载很平衡,功耗也差不多,异步模式就没什么用了。
Exynos5250的测试就没什么好说的了,不过AnandTech显示加入APQ8060A进行对比,然后加入Exynos5250重新对比了一遍,为了节省篇幅我们就直接看四个参赛选手的对比了。
测试方法和之前的完全相同,所有数据也都是独立得来的,也分为平台功耗、CPU功耗、GPU功耗三部分,而且
除了实时曲线,这次还增加了平台消耗能量,以及三部分的最高、最低、平均功耗的确切数值,对比更加清晰。——要知道单纯的功耗指标是没有太大意义的,还得结合完成任务的时间,综合衡量总的能耗才最有对比意义。 为方便表述,以下分别将Tegra3、AtomZ2760、APQ8060A、Exynos5250(包括对应平台)简称为T3、Atom、S4、A15。
【待机功耗】 
A15的平台待机功耗明显偏高,不过Android系统的主屏幕上来就是稳定的,不像Windows那样需要一段时间,所以紫线很快就结束了。S4比较稳定,介于T3、Atom之间。

现代CPU的电源门控(PowerGating)都几近完美,空闲的时候基本没什么消耗,A15、S4都要比T3、Atom更优秀一点。

Mali-T604更加出色,待机功耗几乎为零,相信这也有三星32nmLPHKMG工艺的功劳。Adreno225也不错,曲线不够平滑,但比Atom更低。

飞行模式下的平台功耗更低了一些,尤其是Wi-Fi很差劲的AtomW510,但总体趋势都差不多。Mali-T604的曲线几乎都全程为零了。
             【Exynos5250的热设计功耗】 最后解决一个小问题。测试中可以发现,A15架构的Exynos5250无论CPU部分还是GPU部分,峰值功耗都经常达到4W左右,但不会同时跑到这么高,那么如果CPU、GPU都运行在最高状态会消耗多少呢?我们上Nexus10同时跑CoreMark、《现代战争3》,分别以红线、蓝线、绿线代表平台、CPU、GPU功耗,并按颜色将整个过程分成五段。

在第一段(黄色),很吃显卡的《现代战争3》让GPU功耗接近4W,CPU功耗则不到1W;几分钟后切换出去,GPU功耗迅速下去了,CPU功耗比第一段后程略有提高;第二段(橙色),启动多线程测试工具CoreMark,CPU功耗很快就超过了4W,GPU则基本不活动。
接下来第三段(粉色),CoreMark保持运行,切回《现代战争3》,GPU全速开动接近4W(电压也上去了),而此时因为CoreMark变成了后台程序,CPU为它将频率降低到了800MHz,功耗也慢慢下来了,把资源让给GPU。
第四段(蓝色)重新切回CoreMark,CPU、GPU再次交替;第五段(绿色),又回到《现代战争3》,第三段场景重现,CPU+GPU合计功耗有一段时间达到了8W左右,但随后因为散热达到极限而降了下来。
这样一来我们就可以说,
Exynos5250的日常最大功耗在4W左右,峰值可以冲到8W。为什么要测试这两个数据呢?
因为IntelHaswell就准备把热设计功耗降到8W,到了再下一代14nmBroadwell完全可以轻松做到4W以下,那时候ARM、x86的性能和功耗对比就会非常有意思了。

Haswell冲击8W
【最后的话】 我们已经知道,AtomZ2760的性能要比KraitS4好不少,但从功耗角度看,二者可谓针锋相对。平台层面上(至少是宏碁这款W510),Intel占优一些,但如果其它平板对屏幕和其它元件进行改良,这种优势很容易被逆转。
CPU核心方面高通领先,但这没有算上二级缓存,不过考虑到缓存的功耗并不会太大,即便加上的话相信高通也会更好一些。
GPU这边么,ImaginationPowerVSSGX545的功耗确实很低,但是在3D性能上Adreno225要好得多,玩个小游戏跑个加速什么的还得是后者。Intel在低功耗高性能GPU方面确实需要好好下功夫。
高通S4的待机功耗也非常惨出色,说明在面对台积电28nmLP工艺的时候,Intel32nm也有点“落后”了,不过别忘了Atom架构已经有五年历史了,Intel32nm也快三年了,二者结合仍能有如此表现你不得不佩服。今年Intel还会拿出崭新的22nmSoC,这会让ARM阵营很恐慌的。
Cortex-A15当然更值得说说。它在性能上可以挽回Cortex-A9不低Atom的局面,但也在功耗上付出了很大的代价,功耗是高通、Intel的少则一倍、多则四倍。夸张的曲线和数字一直令人心惊。 无论是从测试数据还是从现实情况看,
Cortex-A15短期内更适合轻薄笔记本、高端平板机,想进入智能手机的话一则要大幅度降频,但性能也就下来了,二则就是配合Cortex-A7核心组成big.LITTILE,从而兼顾性能与功耗,事实上ARM就是这么推行的,三星等也在这么做。不知道苹果下一步会怎么设计自己的CPU核心?
至少就短期内而言,ARM、x86两大阵营可以以4W为分界线,向下是ARM的天地,向上则是Intel的地盘。放长远了看么,14nm时代的x86或许就完全有能力把酷睿架构带到智能手机里,再不行2017年左右的10nm总可以了,那时候或许就能在手机上看到主流级别SandyBridge/IvyBridge处理器的性能了呢。 有趣的是,Intel拼命降低功耗的同时,ARM却在走一条相反的路,努力提升性能而慢慢牺牲功耗,这样对于其进军桌面乃至服务器是必要的,但要想稳住智能手机和平板机阵营,恐怕就得认真对待Intel了。
高通卖出了有力的一步,苹果的下代架构有可能带来惊喜。
如果将ARM比作新的AMD,高通和苹果就是做新Athlon64的,只不过这一次,Intel不会再弄个Pentium4出来了。