J9九游会真人游戏第一品牌AMD最新推土机处理器doc

J9九游会真人游戏第一品牌AMD最新推土机处理器doc2024-01-08 21:20:07

　　J9九游会真人游戏第一品牌AMD最新推土机处理器docAMD最新推土机处理器其实推土机FX系列处理器在就已经全球正式发布，推土机从根本上改变AMD处理器的底层架构设计，简单地说就是变为模块化。AMD宣称推土机相比K10可在每瓦特性能上提升30-100％，会成为“有史以来最高性能的单线程和多线程计算核心”。双核心一模块在着手设计下一代x86处理器核心的时候，AMD的工程师们认为必须实现核心功耗与面积的优化，而且PC应用的发展也让工程师们必须寻找一条新的路子，能够在不同核心之间实现峰值带宽的最大化，并通过共享模块来充分利用每一平方毫米的核心面积。八核心推土机是AMD公司历史上制造的最大规模芯片，集成了大约20亿个晶体管，是六核心Phenom II X6、四核心Sandy Bridge的两倍多，但通过功能单元的合理分配，以及32nm SOI新工艺的应用，核心面积被控制在仅仅为315平方毫米，比六核心、45nm工艺的Phenom II X6还要小9％，比四核心、32nm HKMG工艺的Sandy Bridge也只大了46％。【推土机模块化架构(二)】浮点推土机中的浮点单元也经过了完全重新设计，可以在不同核心之间共享资源。每个推土机模块内都有共享的两个128位乘法累加单元(FMAC)，可以每个核心执行128位指令，或者每个模块执行256位指令。推土机浮点单元还改进支持了大量新的指令集。Phenom II X6仅有128位浮点，Intel Sandy Bridge增加了SSSE3/SSE4.1/SSE4.2、128/256位AVX、每周期两个128位AVX、每周期128位AVX+SSE。推土机不但将这些照单全收，还独家支持FMA4乘加指令、XOP扩展操作指令(曾经的SSE5)。另外在每个时钟周期内，推土机运行双精度x87指令的速度为8FLOPSs，持平Sandy Bridge且比Phenom II X6快一半，128位AVX指令的执行速度则是64FLOPS，前者达到了Sandy Bridge的两倍。? 指令集的变化自然需要软件的支持才能发挥效力，尤其是FMA、XOP两大独家指令。如果软件还在使用老的浮点指令，推土机的特点显然就发挥不出来。在操作系统和软件程序完善之前，可以运行一下AMD提供的两个XOPJ9九游会官方网站、AVX补丁程序，再跑分就会有明显的不同。其实，这两个小程序正是近日网上传闻的所谓“鸡血补丁”，而且有时候确实能“鸡血”一下，比如让FX-8150 wPrime 32M运算时间从15秒钟缩短到10秒钟。? 共享前端前端(Front End)的任务是驱动处理管线、确保核心随时获取所需信息。在推土机中，每个前端配合一个模块，并负责为其中的两个核心分配线程。AMD在这里也做了大刀阔斧的改进，涉及不相关预测和拾取管线、预测定向指令预取器等等。一个预测队列可以管理一级、二级分支目标缓冲(存储目标地址)所需的直接、间接分支。推土机模块可以在每个时钟周期内解码最多四条指令，而K10 Phenom II只有三条。换句话说，推土机从三发射变成了四发射，就像Intel Sandy Bridge。预测管线会生成一个拾取地址队列。拾取管线则在每个时钟周期内从指令缓存里拉取32个字节加入拾取队列，再送往。推土机和Sandy Bridge一样使用了物理寄存器文件(PRF)。这是一个单独的位置，用于保持执行指令的寄存器结果。这种设计可以消除不必要的数据移动和复制，只保留一个拷贝而不用对数据进行广播。? 缓存推土机的每个核心都有64KB一级数据缓存、64KB一级指令缓存、32-entry全关联数据页表缓存(DATA TLB)、完整乱序载入/保存单元，后者可以在每个时钟周期内载入两个128位或载入一个128位指令。每个模块配备2MB 16路关联二级缓存、124-entry二级页表缓存，可同时处理指令和数据请求。推土机支持最多23个二级缓存不命中，用于保持内存系统一致性。最后，一颗推土机处理器的所有模块与核心共享8MB 64路关联缓存。

　　原创力文档创建于2008年，本站为文档C2C交易模式，即用户上传的文档直接分享给其他用户（可下载、阅读），本站只是中间服务平台，本站所有文档下载所得的收益归上传人所有。原创力文档是网络服务平台方，若您的权利被侵害，请发链接和相关诉求至电线) ，上传者

上一篇: 推土机跳票不给力 intel各价位CPU推荐下一篇: 中国极限玩家将AMD推土机超破8GHz！距离第一只差533MHz

新闻动态

J9九游会真人游戏第一品牌AMD最新推土机处理器doc2024-01-08 21:20:07