最佳日常交易
最佳日常交易

关于Androidbob体育提现bob哪个彩靠谱权威的链接可能会使我们赢得佣金。学到更多。

仔细观察ARM的Mali图形技术

ARM的Mali GPU阵容可为硅制造商的可扩展性从眼睛弹出3D图形到低功率可穿戴设备的可扩展性。
经过
2015年4月30日
手臂MALI-T880

当今的高级智能手机和平板电脑正在推动小型图形处理单元(GPU)的限制,在显示屏上吹嘘的主机质量图形比大多数客厅电视更大。但是,如今,不仅需要专用图形硬件的高端移动空间。智能手表和紧凑型智能电视盒的不断发展的市场也利用GPU。最普遍的移动GPU范围之一是Arm的Mali,我们很幸运地仔细研究了上周在ARM的Tech Day上的Mali GPU系列的未来计划。

最近,Arm宣布了其节能马里-T880以及用于高端移动设备的T860,以及其T820和T830设计,用于实施成本效益。T880拥有其MALI-T760设计的峰值性能的1.8倍,同一工作负载的能量减少了40%,并支持超高分辨率4K含量。

如果OEM需要,ARM也没有排除低功率可穿戴设备的MALI-450设计。
在通常受硅成本约束的低端,T830和T820旨在将模具面积的大小降低到T622的50%,为各种应用提供缩放,并且仍然支持最新的图形和最新的图形和compute APIs, such as OpenGL ES 3.1 and Microsoft’s Direct X 11.1. In fact, the Mali-T820 is now the smallest OpenGL ES 3.0 compliant design that ARM has.

手臂马里GPU路线图
尽管引入了新的GPU设计,但像Mali-450这样的传统芯片仍然非常适合较少的性能苛刻应用,例如可穿戴设备。支持良好的支持,这种设计可能会持续一段时间。如果OEM需要,ARM也没有排除低功率可穿戴设备的MALI-450设计。

Midgard Architecture概述

ARM的最新设计仍在其Midgard Tri-Pipe架构上,该架构容纳了“着色器核心”内部的大多数但并非所有关键的GPU组件,从而可以通过简单地调整内核数来扩展性能。大多数其他GPU设计都不采用以这种方式扩展的设计,但这允许ARM针对具有相似设计的一系列使用情况。

mali_shader_core

在高端,Mali-T860每个着色器核心具有3个Alus,与T860和T760的每核2 Alus相比,以及负载/商店和纹理单元。这种额外的ALU可提供每核计算性能的50%。根据GPU所需的性能水平,T880和T860设计都可以从单个相干核心实现来缩放到16个连贯的核心实现。

使用移动设备,性能和功率的最大限制因素来自内存。简而言之,可用的带宽远低于控制台或桌面图形等效物,这意味着可以通过内存来瓶颈性能。为了克服此问题,ARM使用ASTC,AFBC,智能组成和交易消除技术,优化其用于常见工作负载(例如用户界面任务)的体系结构,并试图通过发送更高质量的信息来减少内存交易的数量。这也是为什么ARM实现基于瓷砖的渲染的原因,因为将框架的活动瓷砖尽可能长,而不是将其推向较慢的主内存。

行话巴斯特:

  • 阿鲁- 算术逻辑单元是用于执行整数数学和位逻辑的数字电路。
  • 瓷砖渲染- 将场景分解为较小的瓷砖,然后可以将其分别渲染到片上内存。
  • 消除交易- 通过跳过上一个帧的重复图块来减少处理。
  • AFBC- 手臂框架缓冲区压缩通过使用无损压缩来存储框架来节省内存带宽。

不仅如此,而且从内存中持续的写作和阅读是一项昂贵的任务,用LPDDR4消耗了约100兆瓦的1Gbps带宽的功率。取而代之的是,ARM建议硅制造商在缓存上花费更多的空间来减少功耗,并帮助保留GPU上的尽可能多的数据。

完整的马里GPU
大多数其他GPU设计都不会以这种方式进行扩展,但这允许ARM针对一系列用途的情况
说到权力,ARM还做了很多工作来在执行最常见的任务时优化其最新的图形处理器以提高能源效率。当用户通过UI移动时,这大部分都属于推动像素,无论您相信与否,都需要图形处理。那些光滑的房屋屏幕过渡不是免费的。

下端T830和T820继承了许多这些高端功能,但是带有标量单元的管道已从ALU中删除。T830每个核心具有2个Alus,而T820仅具有1个Alus,并且两者都可以缩放高达4个着色器核心GPU。

ARM MALI-T880性能

很像新的ARM Cortex-A72 CPU,马里的最新迭代显然集中在能源效率上,并提取更多的性能,同时粘在移动平台的紧密功率和热约束中。通过减少内存和功率需求,硅合作伙伴应自由包装其他GPU内核,从而在前几代提高性能。

马里的未来

说到功率,转移到16NM FinFET流程也肯定会为GPU设计带来不错的收益。随着功耗和设计尺寸的缩小,ARM的高端硅合作伙伴将能够将更多的着色器核心挤入其SOC设计中,因为我们已经在三星的八个Mali-T760 Core 14nm中看到了正如我们已经看到的那样Exynos 7420。在较低的成本市场中,GPU将使用较小的足迹来增加核心数量,或者节省越来越昂贵的硅成本。

以前,我们还涵盖了对高分辨率摄像头和显示器的额外记忆带宽的需求,但是这种额外的带宽和相关的功耗可能是我们电池的大量消耗。随着移动市场推向更高的分辨率内容,ARM的存储器节省技术和一般优化也可以带来红利。

随着ARM提供完整的POP-IP软件包已经为16NM FinFET制造设计,我们很可能会在2016年左右看到一些更节能和强大的基于马里的SOC在市场上投放市场。