首页 > 业内新闻 > GPU > 突破应用樊篱,移动GPU市场方兴未艾

突破应用樊篱,移动GPU市场方兴未艾

52RD.com 2014年10月14日 国际电子商情            评论:0条 我来说两句
  

  在智能移动终端产业一派繁荣的景象之下,CPU处理器的发展已几近极限,而移动端对于 GPU图形处理器的性能需求却远远没有停止。根据市调机构Jon Peddie Research针对2013年上半年个人移动设备(智能手机、平板电脑以及掌上游戏机等)GPU出货量情况的统计,由于获得苹果与三星等应用处理器的采用,Imagination Technologies公司以37.6%的市场占有率位居IP供应商的第一位;高通以及IP授权商ARM、Vivante则紧随其后。

  

  各移动GPU供应商的市占率统计

  Source:Jon Peddie Research

  与此同时,近一年来,移动GPU市场正处于飞速发展之中,特别是从去年下半年开始,各大厂商纷纷加大了对移动GPU市场的布局力度:去年年底,ARM同时推出了两款分别针对高端市场和入门级应用的移动GPU(Mali-T760与T720);今年初,Imagination则推出了高端系列PowerVR Series6XT GPU和入门级Series6XE GPU;Vivante发布了基于Vega技术、可有效处理4K媒体的GPU IP内核(GC7000);高通大力宣传自己的下一代移动GPU Adreno 420,并已用于骁龙805上;NVIDIA发布的Tagra K1首次把PC级的GPU搭载到了移动处理器上。所有迹象表明,在不同公司的企业经营策略之下,移动GPU市场正呈现出日益激烈的市场竞争态势,更多具有鲜明个性化特色的芯片方案将不断涌现在市场之上。

  克服移动运行环境的局限

  

  ARM多媒体处理器事业部市场营销副总裁Dennis Laudick

  对比应用在PC上的GPU性能,ARM公司多媒体处理器事业部市场营销副总裁Dennis Laudick认为,GPU在移动设备运作环境中与在PC中是全然不同的。例如,应用在PC上的GPU可以通过一个AC电源获取到大量的电力,并通过非常高功耗PCI等接口连接到大量的内存带宽,这样的例子不胜枚举。因此,在PC环境中开发的技术并不会去考虑功率/面积/热/带宽等限制,而是更加直接地藉由越来越多的电力和资源来提高性能。

  

  Imagination Technologies公司PowerVR 多媒体业务总监Peter McGuinness

  “但在移动环境中的GPU则正好相反,它必须要面对各种不同的约束。在移动的环境下,电源供电是一个巨大的问题,从最初设计开始,GPU(或处理器)就需要考虑功耗问题,这需要充足的专业技能,才能从运行环境中获得最大化的性能。另外,移动设备的环境也存在带宽的限制,必须在设计出令人难以置信的轻巧电源的同时,还要能为用户提供良好的产品性能和应用体验。”因而从根本上讲,在PC与移动设备上的GPU是完全不同的运作形式,PC中的GPU一般采用简单、全屏、“立即模式”的渲染方式;而移动设备的GPU则采取分块渲染等更节能的技术,让庞大的任务处理更加智能化,以确保用尽每一“滴”能效。

  从工作模式上,Imagination Technologies公司PowerVR多媒体业务总监Peter McGuinness更为详细的介绍道,PC机GPU在传统上纯粹以性能为导向,而移动GPU则是为高效率和低功耗所设计的。桌面GPU是典型的提前Z(early-Z buffer)运行模式,通过冷却机制来解决功耗问题;移动GPU大多基于分块渲染模式,将内存流量和功耗保持在最低水平。一些移动GPU主要依靠运行提前Z模式来筛选出可见目标,但这种方式可能会占用大量的面积和功耗。Imagination推出的 PowerVR则采用延迟分块渲染的模式,仅计算并呈现可见的目标、而省略被遮挡的不可见目标元素,从而拥有独特的性能优势。

  低功耗、小面积设计至关重要

  谈到移动GPU最引人关注的低功耗问题,Laudick说道:“低功耗并非只是一种方法或应用到产品以及设计的一些技巧,它必须在产品设计之初就深植于设计人员与产品规划的思考核心。这意味着,很多设计准则与基本架构有关,然而,有些设计准则却是通过外部接口来实现、又或是一些在设计上特定的先进技术上去节省功耗。”为了克服移动设备对GPU先天上的限制,ARM一直在寻找在小面积和有限的功耗内提升处理能力更有效而智能的方式。其中,ASTC纹理压缩技术就是一项源自ARM图像质量方面先进的技术,能减少内存带宽和功耗,这项技术已经被主要的移动GPU芯片供货商所采用。

  另外,ARM还开发出一系列先进技术,进一步提升产品性能。如:智能合成技术用于减少带宽,可同时在帧结构中读取纹理;智能消除技术可实现关键的节省带宽功能,在SoC层级达到显着的低能耗效果,而GPU在渲染的过程中,在帧与帧之间只会就不同的部分进行渲染;帧缓冲压缩格式是一种无损图像的压缩技术,允许通过减少SoC内部IP模块之间传输的数据量,大幅减少带宽的消耗;像素本地存储技术是最近在SIGGRAPH世界图形图像学术大会上所展示的另一种技术,能藉由减少对先进图形算法的带宽需求,达到低功耗的效果。

  得益于专为真实世界应用案例所设计的低功耗特性集,Imagination新推出的PowerVR Series6XT和Series6XE系列均基于PowerVR Rogue图形架构所带来的大量独特特性,以改进整体系统性能,降低功耗,并减少内存带宽。McGuinness分析道:“首先,PowerVR Rogue GPU采用标量处理,实现ALU的最高利用率并简化图形编程,这一架构效率对于优化图像处理算法十分必要,很多算法拒绝将色彩信息作为第一步,并只处理强度信息,而这在标量架构中完全不是问题。其次,我们增加了新的PVR3C三倍压缩技术,结合了有损纹理压缩、无损图像压缩和无损几何压缩技术,降低内存带宽,且反过来更加显着地影响了系统范围的功耗。第三,系统增加的PowerGearing功能可动态管理不同的功耗水平,并平衡整体SoC功耗,所有的Rogue GPU结合使用FP32和FP16 ALU,实现了高精度和低功耗运算,与上一代GPU相比,PowerVR Series6XT和6XE GPU拥有高达50%的更多低能耗GFLOPS(每秒执行浮点运算次数)。”

  

  Imagination公司移动GPU发展路线图

  除此之外,对于瞄准入门级平台的芯片供应商来说,生产更大面积的SoC系统级芯片意味着成本的提高,因此,处理器芯片的面积也变得越来越重要。为了解决这一问题,Imagination可以为合作伙伴提供优化设计工具(DOKs),为各种特定应用实现性能、功耗和面积之间的理想平衡。例如,Imagination与美国新思科技公司共同开发的第一款优化设计工具可为PowerVR Series6 GPU芯片节省高达30%的面积,并且同时还能显着降低动态功耗。

  GPU与CPU协作成主流趋势

  在对近期移动终端市场的观察中,Laudick指出,一个有趣的现象是,市场上设备所具备的多媒体功能越来越受到人们的关注。例如:摄像功能不但是大部分移动终端产品的标准配置之一,而且设备处理图像、视频等多媒体的性能也正在成为影响消费者购买产品的一个重要因素。在这些多媒体应用中涉及到大量像素处理任务,这一方面可以在CPU上完成,而另一方面,图像处理和视觉计算的任务类型具有并行特性,也意味着它们非常适合通过GPU来运行,有助于加快任务处理速度,同时显着降低功耗。

  “我们需要用不同的角度来看GPU,它不再只是针对图形处理方面,而是作为整个系统的一个组成部分。特别是在现有CPU所面临到的节能挑战中,寻找GPU可以用来作为一部分解决方案的可能性,将是未来的一个主要方向。”Laudick说。为此,实现在GPU和CPU的指令执行间共享数据的能力,是一种较为理想的解决途径。这种方案通过缓存一致性以及虚拟内存共享,得以实现CPU与GPU之间的指针交换,由此消除复制或缓存维护操作,这样,GPU可以更多地被用于加速更小型任务的计算能力,使其适合更广范围的算法。

  作为异质运算架构基金会(HAS Foundation)的创始成员,ARM正参与制定此类特性设计所须遵循的标准,并引入到其GPU和CPU的产品设计中。除了Mali-T600系列(业界首款可提供OpenGL ES 3.0功能的移动GPU)之外,ARM推出的Mali-T760 GPU可扩展性达到16个内核,是专门为解决高性能、高端移动计算的市场需求而设计,这类市场的特点是更大的屏幕尺寸、需要处理更复杂的内容、更高的能源效率、在每毫瓦的消耗中追求性能最大化。而一款Mali-T720 GPU则主要为了满足SoC制造商针对入门级移动计算设备市场的需求。

  移动设备的性能越来越取决于不同的系统,尤其是CPU和GPU的相关能力,这使得最佳的工作负荷分配显得十分重要。通常最好的处理办法是将工作量分成最大可能的几个部分,以减少系统开销。McGuinness同样表示道:“移动设备如今正在被内在异构的应用程序所主导,这些应用程序包含功能层,这些功能层可以在CPU阵列和GPU之间被划分GPU被归类为一个单核,但是事实上它本身包含一个大型阵列,并因此实现更好的效率。通过在所有可用资源中更高效地分配任务,转化成一个更高的帧率或更低的功耗或更快的响应能力,或者三者兼得。”例如,一个VP9视频解码器的软件运行方式可以被分解,这样代码的特定部分可以运行在一个四核的CPU上,同时算法的计算密集部分可以由一个PowerVR Rogue GPU 处理。这一异构解决方案虽然没有明显降低功耗,但显着维持了高度优化的CPU代码的帧率,这样处理的好处在于:当解码器是在基于浏览器的应用程序内被运行时,用户将享受更大的可用性、更高的分辨率、更短间隔的CPU周期,且用户界面的响应能力也会获得明显的改善。

52RD.com  微博关注:http://weibo.com/52rd  微信关注:admin_52RD
已有0位网友发表了看法 我来说两句
读取...
相关报道
评 论
新闻导航 Navigation
精彩评论 Commentmore...
52RD网友:这损招虽然损点,不过挺有意思啊,哈哈 手机圈的对于红米相信大家都有自己的见解,说到旗舰... 真心说小米没底限,魅族好歹还自己做机.…
小米将发布1499元红米旗舰机 应对MX4…
52RD网友:李楠没脑了,士别三日,刮目相看,海思CPU现在进步不小,尤其是无线通信能力(LTE核心技术专利),已经有超越高通的趋势了;华为终端最伟…
魅族:MX4 Pro处理器比华为海思好N倍
ldh135:一些就知道窝里斗的家伙!还五百强的胸襟?怎么没国产机敢去拉苹果下水?这种做法只会让外人嘲笑。我是做手机的,华为、小米、魅族都用过…
小米雷军大打口水仗:为什么被黑的总…
52RD网友:最烦点胶!很简单的逻辑,一块PCBA上,IC是否都点胶了,如果仅BGA等大一点的器件点胶,是否说明此类BGA管脚的焊接可靠性天生不如其他不用…
小米华为因芯片点胶问题打口水仗 三…
52RD网友:这次见到大学同学,刚给父母买了两部小米,据说周围同事也都是首选小米。原因在于MI系统的确很好用。 而华为,说是也买过,用了半年听筒…
小米雷军大打口水仗:为什么被黑的总…
特别推荐 Recommend