当前位置:首页 > 平板电脑 > Android平板 > 技巧
性能提升4倍 Mali-T700系列GPU解析
  • 2013-11-18 14:25:01
  • 类型:原创
  • 来源:电脑报
  • 报纸编辑:何庆
  • 作者:
【电脑报在线】提起ARM,大家首先想到的肯定是Cortex A系列处理器,目前绝大多数智能手机和平板电脑采用的都是Cortex A架构的处理器。但是许多人却忽视了,ARM在GPU领域的实力也不容小觑。在过去几年里,该公司Mali GPU的出货量增长了10倍多,50%的Android平板以及超过20%的Android智能手机用的都是Mali GPU。形势一片大好,ARM打算乘胜追击,前不久Mali家族的最新成员Mali-T700系列 GPU正式推出。
  提起ARM,大家首先想到的肯定是Cortex A系列处理器,目前绝大多数智能手机和平板电脑采用的都是Cortex A架构的处理器。但是许多人却忽视了,ARM在GPU领域的实力也不容小觑。在过去几年里,该公司Mali GPU的出货量增长了10倍多,50%的Android平板以及超过20%的Android智能手机用的都是Mali GPU。形势一片大好,ARM打算乘胜追击,前不久Mali家族的最新成员Mali-T700系列 GPU正式推出。

  
Mali-T700的三大改进
1.第三代Midgard架构
     在Mali T600之前,如Mali-T400采用的是Utgard核心架构。这种架构采用的是垂直型图形管线构造,顶点着色器和像素着色器是彼此分开的,这类似于DirectX 9时代的显卡核心架构。因此采用Utgard核心架构的GPU在非图形处理的通用性上要低许多。为了解决这一问题,ARM对GPU架构进行了更新,开发当前显卡GPU一样的统一渲染架构,于是Midgard架构就诞生了。Midgard架构的特点就是在提升通用处理性能的同时,不会影响图形处理效率。Midgard架构在设计上更容易实现多核心,16核甚至更多核的GPU也是可能实现的。在核心数量称王的时代,Midgard架构具有明显的优势。首款基于基于Midgard架构的GPU,就是2010年11月发布的Mali-T604,第二代产品就是2011年1月推出的Mali-T658,而Mali T700则属第三代Midgard架构。
     与目前Mali-T600系列所采用的第二代Midgard架构相比,新的GPU在内部架构上进行了重新设计,特别是大幅度改变了着色器核心的配置方式。Mali-T700的着色器数量是之前的T658的两倍——最多拥有16个着色器核心(Mali-T760),以每四个一组进行管理,这样通过调度机制,每个核心群都会分到相同的处理任务。而着色器间的内存同步以及核心群间的系统控制模块依然保持。不过核心群间依然采用独立的L2 缓存和Snoop单元,彼此之间的联系通过AMBA4总线实现,因此可以认为任务的分配可以根据需要实现最佳化。同时Mali-T700每个着色器核心内都有四个ALU簇,也较上一代GPU番了一番。此外,Mali-T600的ALU是标量单元、矢量单元的混合,Mali-T700也对此做了相应的优化改变。


Mali-T760内部结构图


2.支持ARM 帧缓冲压缩,更省内存带宽
     支持ARM帧缓冲压缩格式是Mali-T700的一大亮点。我们都知道,视频和图形是内存带宽的消耗大户。随着屏幕越来越大和分辨率越来越高,如果不采取行动的话,带宽和功耗也会水涨船高,但任何减少内存带宽的技术也会带来降低功耗的目的。与桌面GPU动辄256bit甚至384bit的位宽、1.2~1.5GHz的高频显存相比,手持设备通常搭配的是低功耗、窄带宽的LPDDR、LPDDR2等特殊内存——普遍使用的是双32bit位宽、LPDDR2-800或1066左右的内存系统,总带宽普遍在10GB/s以内。没有高带宽就没有大容量纹理数据,也就不会有高画质。在内存带宽有限的限制下,移动GPU厂商关心的头等大事就是如何在尽可能小的带宽下提升GPU的性能。为解决视频应用时所遇到的内存带宽难题,ARM 开发了 ARM 帧缓冲压缩格式,该格式能够提供快速、实时的无损压缩与解压缩,最大限度地减少GPU内不同模块之间的数据传输量,从而减少对带宽的需求,并将相应功耗降低至多达50%。举个例子,在玩《愤怒的小鸟》过程中,游戏场景的整个框架并不需要重新渲染,真正渲染的地方只有当小鸟击飞猪仔时需要,因此做到GPU功耗降低。
  此外,Mali-T700在支持OpenGL ES 3.0时还支持ASTC 纹理压缩格式,可以自动调节最佳压缩比,单一像素可以压缩至1bit到8bit。例如,看不出画质影响的部份用1bit到4bit来压缩,需要高画质的区块则用8bit,除了能减少纹理材质的传输大小外,也能让游戏开发人员开发起来更容易。这让手持设备的高画质游戏得以全面减少纹理材质上的带宽耗损,维持游戏的画面质量又可减少带宽。




 

3.辅助处理器计算

    随着GPU性能的不断增强,图形计算不再是GPU的唯一工作。Mali-T700就可以帮助CPU更好地处理某些任务,比如现在非常受人关注的面部识别、手势操作和增强现实等功能,尤其在big.LITTLE技术的处理器里GPU可以做的将不仅仅只是图形渲染。


Mali-T760、Mali-T720,打虎亲兄弟
   Mali-T700系列目前仅发布了Mali-T760和Mali-T720两个型号,分别针对高端及主流移动GPU市场。其中Mali-T760将代替Mali-T604成为最新的旗舰级移动GPU,它最大支持16着色器核心,工作频率可达600MHz,峰值运算速度高达326GLOPS,拥有每秒9.6GPIX的像素填充率。从这组数字来看,Mali-T760 GPU的确是最快的移动GPU,而且能效相较Mali-T604提升400%。当然Mali-T700将主要搭配Cortex-A15、A53、A57等高端CPU。瑞芯微首席营销官曾表示,Mali-T760的简单性和丰富的功能设计,有利于帮助瑞芯打造全新的移动处理器,缩短产品研发和上市速度,进一步扩大Android的市场份额。这意味着,未来大部分国产平板电脑均有机会搭载AMR这款新旗舰级GPU。同时完整支持OpenCL规范是Mali-T760的一大亮点,同时也是移动GPU中唯一做到的一款,因此该GPU运行所有针对OpenCL的Benchmarks跑分工具都不是问题,真正标志着智能手机和平板电脑的GPU性能全面上升一个档次。


Mali-T760一览


  至于Mali-T720,主要接任目前主流的Mali-400MP和450MP两款GPU,因此规格就没那么令人兴奋了。Mali-T720的每个着色器核心内只有一个ALU簇,而且最多只支持八个核心,虽然它的最高频率也是600MHz,但像素填充率和三角形输出率都较Mali-T760有明显的降低——峰值运算速度为81.6GLOPS,像素填充率为每秒4.8Gpix,不过仍远高于Mali-400MP(峰值运算速度为19.2GLOPS,像素填充率为每秒1.6Gpix)的性能。Mali-T720的亮点在于能耗比方面,据AMR介绍,Mali-T720与前代相比,能效比提升了150%,面积也比目前的Midgard架构GPU减少了30%。同时采用了最新的28nm制程工艺,保证在更小的面积上可以塞进8个Shader核心。既然定位要所下降,新的Mali-T720的搭档也有相应的改变——这款GPU主要与AMR现行的Cortex-A7和Cortex-A12内核组合,也可以与即将在明年正式登场的64位Cortex-A53架构整合成处理器。


Mali-T720一览


Mali-T700,仍需等待
  Mali GPU的优势在于可以和Cortex-A处理器一起,向厂商推出一条龙解决方案。厂商可以向ARM同时购买CPU和GPU的授权,生产自己的SoC芯片。虽然早期的Mali 芯片在性能特别是兼容性上存在一定问题,不过在经过长时间改进,特别是 ARM的一体化推广后,Mali得到了三星这样的巨头支持,Mali无论在兼容性还是性能上优化都有了长足的发展,目前已经很少有出现大的兼容性问题。目前全球有超过84个公司获得ARM Mali系列GPU授权,而Mali-T720和T760现在已经授权给LG电子、MediaTek和Rockchip等公司。
   话说回来,那么这两款GPU到底什么时候才能用上呢?据ARM透露,全新一代Mali-T700系列GPU将从2014年年底出货。这意味着,至少要等到MWC2015世界移动通信大会我们才有机会看到搭载Mali-T760的下一代智能手机和平板电脑,2014年的主旋律还是刚刚开始出货量产的ARM Mali-T600系列。


写在最后:
在移动处理器核战不休的时候,Mali-T700系列GPU的发布无疑会加剧移动GPU的军备竞赛。但是性能的比拼还能持续多久?即便是有了8核、16核GPU,但是不断攀升的性能与功耗,与发热和续航之间的矛盾也终会爆发。显然,这并不仅仅是ARM所需要考虑的问题。因此,未来多核Mali-T700的表现如何仍需市场来验证。 
本文出自2013-11-18出版的《电脑报》2013年第45期 B.平板电脑
(网站编辑:pcw2013)


我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交
读者活动
48小时点击排行
论坛热帖