当前位置:首页 > 装机升级 > 显卡 > 评测
GTX690评测:史上最酷双芯卡皇战双卡
  • 2012-5-4 0:00:00
  • 类型:转载
  • 来源:泡泡网
  • 网站编辑:admin
【电脑报在线】    泡泡网显卡频道5月4日从2001年开始到现在,NVIDIA和AMD(ATI)两大图形巨头烽火已逾十年,每一次卡皇之争都激烈异常。因为有平台功耗和散热极限的制约,同样工艺下GPU核心所能集成的晶体管规模是有限的,旗舰核心规格确定之后,剩下的产品只需要一路删减即可形成高中低端完整的产品线。既要性能卓
开普勒之核心:SMX与SM的改动细节

    全新的Kepler相比上代的Fermi架构改变了什么,看架构图就很清楚了:

    

    FermiGF100/GF110核心架构图

    

    
KeplerGK104核心架构图

    GK104相比GF110,整体架构没有大的改变,GPU(图形处理器集群)维持4个,显存控制器从6个64bit(384bit)减至4个64bit(256bit),总线接口升级至PCIE3.0。剩下的就是SM方面的改变了:

    

    GF100和GF104的SM架构图

    这里之所以要把GF104这颗中端核心的SM架构图也列出来,是因为GF104相比高端的GF100核心做了一些细小的改动,这些改动也被沿用到了GK104当中。另外从核心代号上来看,GK104其实就是用来取代GF104的,而取代GF100的核心另有他人。

    

    GK104的SMX架构图

    NVIDIA把GK104的SM(不可分割的流处理器集群)称为SMX,原因就是暴增的CUDA核心数量。但实际上其结构与上代的SM没有本质区别,不同的只是各部分单元的数量和比例而已。具体的区别逐个列出来进行对比:

    

    1.NVIDIA现在把流处理器称为CUDA核心;

    2.SFU(SpecialFunctionUnits,特殊功能单元)是比CUDA核心更强的额外运算单元,可用于执行抽象的指令,例如正弦、余弦、倒数和平方根,图形插值指令也在SFU上执行;

    3.Warp是并行线程调度器,每一个Warp都可以调度SM内部的所有CUDA核心或者SFU;

    4.DispatchUnit是指令分派单元,分则将Warp线程中的指令按照顺序和相关性分配给不同的CUDA核心或SFU处理;

    5.LD/ST就是载入/存储单元,可以为每个线程存储运算源地址与路径,方便随时随地的从缓存或显存中存取数据;

    6.TMU是纹理单元,用来处理纹理和阴影贴图、屏幕空间环境光遮蔽等图形后期处理;

    通过以上数据对比不难看出,GK104暴力增加CUDA核心数量的同时,SFU和TMU这两个与图形或计算息息相关处理单元也同比增加,但是指令分配单元和线程调度器还有载入/存储单元的占比都减半了。这也就是前文中提到过的削减逻辑控制单元的策略,此时如何保证把指令和线程填满一个CUDA核心,将是一个难题。

    
我来说两句(0人参与讨论)
发表给力评论!看新闻,说两句。
匿名 ctrl+enter快捷提交