010-51299456

AMD最新推土机处理器docx2024-01-26 09:51:25

  AMD最新推土机处理器docx推土机从根本上改变了 AMD处理器的底层架构设计,简单地说就是变为模块化。AMD宣称推 土机相比K10可在每瓦特性能上提升30-100%,会AMD 最新推土机处理器

  推土机从根本上改变了 AMD处理器的底层架构设计,简单地说就是变为模块化。AMD宣称推 土机相比K10可在每瓦特性能上提升30-100%,会成为“有史以来最高性能的单线程和多 线程计算核心”。

  在着手设计下一代x86处理器核心的时候,AMD的工程师们认为必须实现核心功耗与面积的 优化,而且 PC 应用的发展也让工程师们必须寻找一条新的路子,能够在不同核心之间实现 峰值带宽的最大化,并通过共享模块来充分利用每一平方毫米的核心面积。

  八核心推土机是AMD公司历史上制造的最大规模芯片,集成了大约20亿个晶体管,是六 核心Phenom II X6、四核心Sandy Bridge的两倍多,但通过功能单元的合理分配,以及32nm SOI新工艺的应用,核心面积被控制在仅仅为315平方毫米,比六核心、45nm工艺的Phenom

  II X6还要小9%,比四核心、32nm HKMG工艺的Sandy Bridge也只大了 46%。

  推土机中的浮点单元也经过了完全重新设计,可以在不同核心之间共享资源。每个推土机模 块内都有共享的两个128位乘法累加单元(FMAC),可以每个核心执行128位指令,或者每个 模块执行 256 位指令。

  推土机浮点单元还改进支持了大量新的指令集。Phenom II X6仅有128位浮点,Intel Sandy Bridge 增加了 SSSE3/、128/256 位 AVX、每周期两个 128 位 AVX、每周期 128 位AVX+SSE。推土机不但将这些照单全收,还独家支持FMA4乘加指令、XOP扩展操作指令 (曾经的 SSE5)。

  另外在每个时钟周期内,推土机运行双精度x87指令的速度为8FL0PSS,持平Sandy Bridge 且比Phenom II X6快一半,128位AVX指令的执行速度则是64FLOPS,前者达到了 Sandy Bridge 的两倍。

  指令集的变化自然需要软件的支持才能发挥效力,尤其是FMA、XOP两大独家指令。如果软 件还在使用老的浮点指令,推土机的特点显然就发挥不出来。在操作系统和软件程序完善之 前,可以运行一下AMD提供的两个XOP、AVX补丁程序,再跑分就会有明显的不同。

  其实J9九游会官方网站,这两个小程序正是近日网上传闻的所谓“鸡血补丁”,而且有时候确实能“鸡血”一 下,比如让FX-8150 wPrime 32M运算时间从15秒钟缩短到10秒钟。

  共享前端 前端(Front End )的任务是驱动处理管线、确保核心随时获取所需信息。在推土机中,每个 前端配合一个模块,并负责为其中的两个核心分配线程。AMD在这里也做