最佳日常交易
最佳日常交易

关于Androidbob体育提现bob哪个彩靠谱权威的链接可能会使我们赢得佣金。学到更多。

手臂Mali-G76 GPU深水潜水

Mali-G76是基于Bifrost架构的最新ARM GPU设计,有望在G72和类似游戏机般的性能上取得显着增长。这是一个更近的外观。
经过
2018年5月31日
ARM Cortex-G76 GPU

为了追求更大的图形性能,ARM在其Bifrost Architecture Mali-G76的高性能层中的第三层入口做出了重大变化。这些重要的调整中有许多已经进入了中期马里-G52,但G76的目标是在一次迭代中再提高50%。

要了解Arm如何推动其芯片的图形性能,让我们在马里G76内仔细看看。

更多执行车道,更多性能

正如我们在公告中谈到的那样,性能提高的关键在于将每个Mali-G76核心内部的执行引擎数量加倍。在Mali-G7X体系结构中,每个核心包含三个执行引擎,是产品命名方案中MP1的多个执行引擎 - MP2具有两个内核和六个总执行引擎,MP4具有四个用于12个执行引擎的内核。在Mali-G52中,IP合作伙伴可以选择两到三个执行引擎,以更灵活地低中间范围性能。

这些执行引擎包含用于数学的定量线程的执行道。所有这些都并行运行,因此具有更多线程的核心可以在任何时候进行更多的数学。但是,增加车道的数量也会增加带宽,纹理支持以及功率和硅面积要求。

手臂Mali-G76微型建筑

Mali-G76将每个执行单元的车道数量增加到八个,从MALI-G72增加到四个。在单个Mali-G76核心中,现在有24条执行车道,高于G72中的12个。这使单个核心的计算能力翻了一番,导致面积大小增加了28%。G76核心将比以前的G72和G71核心稍大,但它们功能更大,因此我们可以预料,与当前一代相比,图形核心计数将在即将到来的智能手机SOC中。

现在,使用Mali-G76时的最大核心数量也将其限制在20位。与G72的最多32个内核相比,它的最大减少是降低的,尽管我们从未真正看到智能手机的设计与高年轻人相比。尽管核心计数较低,但最大配置中的最大执行车道数量增加。20核Mali-G76提供480条执行车道,而在32核Mali-G72设置中仅提供384条车道。因此,最大配置中的峰值性能可提高高达25%。

增加每个执行引擎中车道数量的第二个主要好处是功耗相对减少 - 相同的工作量的每个核心比上一代核心更有效率。这是因为其他GPU组件的功率抽取在扩大执行车道的数量时大多保持恒定。

ARM MALI-G72能量性能增益

上面的ARM图形表明,尽管算术数据量和寄存器文件的相对能量成本保持不变,但在数据路径控制,缓存和GPU的四型控制部分中可以节省大量效率。与G72相比,在同一过程节点上,G76的能源效率提高了30%。

这些执行车道现在还通过新指令支持INT8 DOT产品数学支持。每个车道每个周期都支持四个多重蓄电的操作,以极大地改善吞吐量。我们已经在中端的马里G52中看到了这种实现。ARM表示,与上一代相比,使用INT8 DOT产品的机器学习应用程序的效率提高了约270%。

平衡设计

随着每个核心计算功率的增加,Mali-G72还具有许多其他改进,以确保设计的变化不会产生任何不必要的瓶颈。

有一个新的双纹理映射器,顾名思义,该映射器建议处理纹理采样,调整大小和放置在3D型号上。它每个周期都有两个十字架,将渲染吞吐量翻了一番。Quad Manager已被优化,以保持八个车道执行引擎和GPU的双纹理映射部分,并用数据供应。

ARM MALI-G76核心设计

Arm’s latest graphics part features a number of other smaller optimizations, including out of order polygon list writeback to prevent stalls during cache misses, varying pre-loads to improve efficiency and depth pre-loads for better multi-render performance, and TLS Address interleaving to improve the speed of cache fetching by better organizing the memory space.

这不仅会导致许多性能优化,而且会随着核心计数的增加而更加线性性能缩放。现在,ARM预计,基本上将线性提升能够提高性能,而核心数量达到高年级,并且在20点上限时只有最小的损失。以前,当靠近最大核心计数时,在缩放范围时,性能提高有些明显的减少。

马里G76 GPU的期望

正如我们从ARM的世代图形改进中所期望的那样,性能和能源效率都可以引起显着的提升。智能手机中的实际实现可能会使图形性能提高多达50%。

在衡量性能时,Mali-G76在表演时提出了一些命名问题。具有较低核心计数的马里G76设计将为现有的G71和G72 GPU提供可比性和更好的性能。G71和G72看到高性能的智能手机在少年时代提供了核心计数,但ARM希望这将降至青少年,即使性能会攀升。例如,与马里G72 MP18相比,Mali-G76 MP14的性能更好。

每个Mali-G76核心最多的功能最多是G72中的两倍。

就像新的Cortex-A76一样,Mali-G76是一种灵活的组件,旨在从中期性能移动设备到更高的性能笔记本电脑以及潜在的AR和VR产品。

Mali-G76现在可以供ARM的合作伙伴许可,这意味着我们可以在年底之前看到设备在市场上使用它。