马上注册,结交更多好友,享用更多功能,让你轻松玩转罗源湾之窗
您需要 登录 才可以下载或查看,没有账号?会员注册
x
在落后竞争对手半年后,NVIDIA发布了Kepler架构单芯旗舰GeForce GTX680,一个月后又陆续推出了双芯卡皇GeForce GTX690和次旗舰GeForce GTX670。虽然新产品的上市为显卡性能树立了新的标杆,但动辄大几千的价格还是令玩家们望卡兴叹,好在近期中低端及入门级产品相继上市,才让许多玩家 们有了体验Kepler性能的机会。
GeForce GT640与GTX650
2012年6月,NVIDIA发布了基于Kepler架构设计的低端产品GeForce GT640。同年9月,NVIDIA再次发布了基于Kepler架构设计的入门级新品GeForce GTX650。两款产品均采用GK107图形核心,拥有相同的流处理器数量、光栅单元、纹理单元和显存位宽。从表面上看,GT640与GTX650最大的 区别在于GT640搭载DDR3显存颗粒,而GTX650搭载的是高速GDDR5显存颗粒,且两者的核心频率存在一定的差距。那么,两款产品的区别仅限如 此么,我们下面来简单讨论一下。 基于Kepler架构设计的GK107图形核心首先应用在GeForce GT640产品上,不过碍于GT640使用DDR3显存颗粒,且核心频率较低,因此无法发挥GK107的架构性能,待搭载GDDR5高速显存颗粒并提升一 定核心频率的GTX650出现,关于GK107架构的争论才暂且尘埃落定。
GK107架构示意图
GK107拥有一组完整的GPC结构,内含2个SMX单元,其实际规模是GK104的1/4,这种标本型的特征让GK107拥有很高的参考价值,我们可以将GK107图形核心的逻辑运算部分直接看做是GK100时代Kepler架构最基本的组成部分。
GTX650显卡规格
受该特性影响,GK107图形核心拥有一套完整的前端以及光栅化处理部分,其单周期的几何输出以及光栅化能力为同频GK104图形核心的25%,或者 同频GK106图形核心的1/3。同时,与之搭配的显存控制器阵列扩展到2个,GK107图形核心因此具备128bit显存位宽。除此之外,GK107的 绝大多数特性均可以和GK106一样参考整个Kepler家族的传统。 GeForce GT640/GTX650与其它Kepler架构产品一样拥有比前代产品出色的性能功耗比,可以说SMX单元和全新Schuduling过程功不可没,在本文中我们不得不将其中的SMX单元再次介绍一下。
SMX单元概念解析 SM曾经是NVIDIA GPU的ALU团簇基本单元,这一单元在GK104图形核心中的改进可谓翻天覆地,NVIDIA采用全新的SMX单元彻底改变了传统SM单元的观念内涵。 GT640/GTX650以及其它Kepler架构所采用的SMX单元与Fermi的SM单元在逻结构上十分 相近,两者都拥有完整的几何前端、线程仲裁机制、ALU团簇、Texture Array、unified cache/shared和Register。除了没有后端之外,一个SM/SMX单元在结构上可以说趋近等同于一颗标准GPU。
SMX单元结构
与Fermi的SM单元规模对应线程粒度单位warp(32 ALU VS 32 Thread)不同,Kepler的SMX单元急剧放大了ALU团簇的整体规模,其ALU总量从过去的32个增加到192个。与此同时,SMX单元的线程 仲裁管理机制也得到放大,负责线程分派和发放管理的Warp Scheduler从过去的两个增加到4个,与之对应的Dispatch Unit从过去的2个增加到8个,Warp Scheduler与Dispatch Unit的比列提升到1:2,这些举措可以有效改善单元规模增大所带来的线程分派及管理压力。 在放大ALU团簇以及线程仲裁机制的同时,NVIDIA还进一步放大了与ALU团簇对应的Register。根据NVIDIA提供的资料,Kepler中每个SMX单元中的Register较Fermi的SM单元放大一倍,达到了65536×32bit的规模。
更为强劲的SMX性能
在Unified Cache体系方面,Kepler与传统的Fermi在结构上没有多大的差异,其L1/shared以及L2/cache的大小和比例均未发生变化,仍旧 维持64K的L1/shared和128K/MC的L2尺寸。整个体系中最值得关注的变动来自L2 cache速度以及带宽的提升,NVIDIA称GTX680的L2 cache目前运行在分频状态下,默认运行频率是核心频率的一倍,这为GTX680提供了比过去大得多的L2带宽,这为通用计算性能以及Texture性 能的提升创造了有利的条件。 更大的ALU规模、更多的线程仲裁机制以及更大的寄存器缓冲为SMX带来了全新的性能表现,新的逻辑设计让GK104的运算单元拥有2倍于Fermi的性能。
GT640/GTX650核心参数对比解析 在对GK107图形架构和SMX单元进行简单的解析之后,继续回到正题。GT640与GTX650采用相同的GK107图形核心,除此之外,两款产品还有哪些直观上的相同与不同呢,我们首先通过GPU-Z来了解一下两款产品的核心参数。
GT640/GTX650 GPU-Z数据
通过GPU-Z可以看出,GeForce GT640与GTX650拥有相同的384个流处理器,相同的16个ROPs单元以及128Bit显存位宽,不同的是GT640仍然采用成本低廉的 DDR3显存颗粒,而GTX650所采用的是高速GDDR5显存颗粒,因此显存频率要比GT640高很多,而且拥有更高的显存带宽。而在核心频率方 面,GTX650为1000MHz起,而GT640仅有900MHz,两款产品均不支持GPU Boot,这种特性也在一定程度上提升了超频性能,这部分我们稍后将作介绍。 GT640/GTX650显卡PCB布局对比解析
GeForce GT640 PCB
GeForce GTX650 PCB
GT640采用GK107-300-A2图形核心,GTX650采用 GK107-450/455-A2图形核心,通过上图的PCB对比可以看出,GT640的PCB设计无论元器件还是布局都要比GTX650显得更“吝啬” 一些。2GB版GT640显存由8颗256MB SDDR3颗粒组成,两两组合分别排列在GPU的上方和右方;1GB版GTX650显存由4颗256MB GDDR5颗粒组成,同样排列在GPU的上方和右方。公版GT640并没有设计外接供电接口,在一定程度上影响了显卡的超频性能,而公版GTX650设计 了单6pin外接供电接口,超频能力不容小视。 我们将GT640和 GTX650的核心频率调至1100MHz来测试两款显卡的基准及游戏性能。采用GK107-400/455-A2图形核心的GTX650可以在默电下将 频率轻松超至1100MHz,而采用GK107-300-A2图形核心且没有设计外接供电接口的GT640需要增加电压才能将频率调至1100MHz。 GT640/GTX650同频理论性能测试对比
GT640 3DMark Vantage理论性能测试
GTX650 3DMark Vantage理论性能测试
GT640 3DMark 11理论性能测试
GTX650 3DMark理论性能测试
在核心频率同为1100MHz的情况下,GTX650在3DMark Vantage P模式中与GT640有将近3500的分数差距,在3DMark 11 P模式中与GT640有425的分数差距,SDDR3显存设计对GT640带来了不小的影响,而且GT640并没有设计外接供电接口,这对超频还会带来不 小的影响。 GT640/GTX650同频游戏性能测试对比
GT640 PLAGame性能测试
GTX650 PLAGame性能测试
GTX650关闭抗锯齿后在光荣使命Benchmark测试中的最终平均成绩为35.3帧,GT640在关闭抗锯齿后的平均成绩仅为25.9帧,9帧直接体现在游戏中就是流畅与卡顿的差距,仅显存规格的不同就令GT640与GTX650有如此明显的性能差距。 GT640/GTX650 OpenCL全局存储测试
GT640全局存储测试
GTX650全局存储测试
通过OpenCL全局存储测试可以看出,搭载GDDR5高速显存颗粒的GTX650无论拷贝还是API拷贝均大幅领先于GT640,不过GTX650自身的拷贝和API拷贝还有将近10GB左右的差距,但GT640的拷贝和API拷贝却相差无几。 GT640/GTX650 温度测试及全文总结
GT640/GTX650温度测试
毕竟GT640与GTX650采用相同的GK107核心,因此两款产品在温度方面的控制也基本相同,除去非公版散热器所带来的温度影响,GT640 与GTX650均达到了合理的温度控制范围。如果不是显存颗粒不同,真看不出GT640与GTX650有什么本质上的区别。
GT640/GTX650同根同源
说GT640与GTX650有相同的血缘关系一点不为过,两款产品采用相同的GK107图形核心,拥有相同的流处理器、光栅单元、纹理单元和显存位 宽,仅在显存规格与核心频率上有所差别,也仅仅是这两部分的不同让两款产品拉开了一定的价格距离。有消息称个别厂商推出了GDDR5版GT640,如果再 设计外接供电接口的话,那和GTX650又有何区别呢?
|