最佳日常交易
最佳日常交易

关于Androidbob体育提现bob哪个彩靠谱权威的链接可能会使我们赢得佣金。学到更多。

Arm Cortex-A76 CPU深水潜水

ARM的最新Cortex-A76 CPU承诺为高性能智能手机提供了重大性能。我们仔细研究了这一基础重新设计,详细介绍了ARM如何实现这些改进。
经过
2018年5月31日

尽管Digits的最新CPU绰号的数字略有变化,但最新的处理器设计是该公司为各地为Android智能手机提供动力的重要版本。bob体育提现Cortex-A76是一个基础的微体系结构重新设计,强调提高峰值性能,也许更重要的是,在紧凑的形态中维持它。根据手臂这只是一系列CPU中的第一个,它将从A76构建以将性能提升到新的高度。

武器Cortex-A76仍然与现有处理器以及公司的Dynamiq兼容CPU群集技术。但是,微体系结构重新设计比Cortex-A75平均而言,加上40%的功率效率。最大的胜利是用于浮点和机器学习数学任务,因此,让我们更深入地研究新设计,看看发生了什么变化。

保持核心饱食

如果有一个一般的主题来理解Cortex-A76的变化,则“更宽”,增强CPU的吞吐量,以使更强大的执行核心良好地融入了要做的事情。

您需要了解的有关Arm Dynamiq的一切
特征

在执行核心中,Cortex-A76拥有两个简单的算术基因座单元(ALUS),用于基本数学和位移动,一个多循环整数和合并的简单ALU来执行乘法和一个分支单元。Cortex-A75只有一个基本的Alu和一个Alu/Mac,这有助于解释ARM基准测试中的整数性能提高。

这是与两个SIMD霓虹灯执行管道配对的,其中只有一个可以处理浮点数划分和多重收益指令。这两种双128位管道都提供了ARM先前CPU的带宽两倍,用于其单个指令多个数据扩展。半精确的FP16支持仍然来自A75,这对于提高低精度INT8点产品扩展也有很大的好处,这些产品在机器学习应用中变得越来越流行。

ARM Cortex-A76微型建筑

A76的另一个重大变化是新的分支预测变量,现在它与指令获取相关。分支预测因子以每周循环为32对16个字节的速度的速度的两倍。这样做的主要原因是揭露许多记忆级并行性 - 换句话说,似乎同时处理多个内存操作的潜力。这对于处理缓存和TLB错过特别方便,并有助于删除管道中什么都没有发生的周期。

Cortex-A76还移至4个指令/循环解码路径上升到八个16位指令,从三个和A73的A75和2的三个指令移动。这意味着CPU核心现在最多可以分配八个µOPS/循环,而不是使用A73的A73和四个。结合八个问题队列,每个执行单元之一和128个输入指令窗口,ARM正在进一步增强处理器的执行指令的能力,以提高每个周期(IPC)性能的说明。

在设计的早期进行较宽,可确保高指导吞吐量,这将使高性能数学单元在管道中进一步延伸,即使在缓存失误期间。这是帮助手臂提高IPC和数学性能指标的原因,但它受到了对区域和能量的打击。

降低记忆的潜伏期

如果处理器被记忆读取和写入瓶颈,那么这些提取和执行改进都不会很好,因此ARM在这里也进行了改进。

与以前相同的64KB,4向相关L1缓存和256-512KB私有L2,但是脱钩的地址生成和Cache-Oughup管道已获得带宽的两倍。内存级别的并行性也是这里的关键目标,因为内存管理单元可以处理68个机上负载,72个机上商店和20个出色的非预购失误。整个缓存层次结构也已针对延迟进行了优化。仅需四个循环即可进入L1缓存,9个周期到L2,而31个周期才能进入L3缓存。最重要的是,内存访问更快,这将有助于加快执行速度。

Cortex-A76提供了改进的单核吞吐量,较低的延迟内存访问和持续性能。

说到L3缓存,在第二代DynamiQ共享单元中最多可支持4MB内存。这个巨大的内存池很可能会通过笔记本电脑类产品保留,因为加倍缓存只会产生大约5%的性能增强。由于较低的性能点以及对硅面积和成本的更严格的限制,智能手机产品最多可能会以2MB的限制。

实现笔记本电脑级的性能(TLDR)

Cortex-A76也是第一个开始从32位支持过渡的CPU。A76仍然支持AARCH32,但仅以最低的特权应用程序级别(EL0)。同时,从操作系统到低水平固件,始终支持Aarch64。在将来的某个时候,ARM可能会过渡到仅64位,但这将在很大程度上取决于所讨论的生态系统。

如果所有这些似乎都是Gobbledygook,那么这里是要理解的关键。一般而言,处理器的速度取决于它在时钟周期中可以做多少。能够做两个添加而不是一个更好,因此ARM添加了一个额外的数学单元,并提高了其浮点(复杂)数学单位的性能。

这种方法的问题是,您需要保持执行单元在做某事或浪费电源和硅空间,因此您必须能够向单位发布更多的说明,并且比以前更快。这会产生进一步的问题,例如增加数据不是处理器认为的可能性(高速缓存),这使整个系统陷入僵局。因此,您需要专注于更好的分支预测和预取,并更快地访问缓存内存。最后,所有这些都花费了更多的硅和力量,因此您也必须优化以控制这些方面。

ARM Cortex-A76详细的基准测试

ARM通过Cortex-A76专注于所有这些方面,这就是为什么经过如此大的重新设计,而不仅仅是对A75的小调整。将所有这些IPC性能的改进与预期降至7nm相结合,我们正在研究与已经令人印象深刻的Cortex-A75相比,典型的典型性能改善。A76也只使用较低频率运行以达到相同的性能目标来完成所有功能。

Cortex-A76是ARM的主要功能,可通过可扩展的用例进行更高的性能计算,从移动设备一直到笔记本电脑(及以后),同时支持使公司如此成功的功率效率目标。我们很可能会在2019年初看到第一批Sport A76的芯片组进入产品。