外媒:苹果 A13芯片吊打所有竞争对手

来源: 匿名 2019-11-06 18:38:30

资料来源:本文由公共数字半导体产业观察(身份证:集成电路银行)翻译自“anandtech”。作者:andrei frumusanu,谢谢。

今年,知名硬件网站anandtech发布了对苹果iphone 11系列和苹果a13芯片的深度解读。在芯片部分,他们深入分析了苹果的芯片。并得出结论:与所有安卓芯片相比,苹果a13的性能最好。

让我们来看看这篇文章的一些亮点:

首先,在制造流程方面,根据anandtech的分析,苹果a13基于euv生产,使用n7节点的性能调整流程,而不是n7节点。他们进一步指出,他们没有透露芯片的具体尺寸,但根据技术人员的说法,苹果新芯片的尺寸为98.48毫米,比去年的a12大18.3%。

在内核性能方面,anandtech表示a13也采用了“2 4”设计,其大性能内核的时钟速度比上一代提高了约6%,达到约2666mhz。然而,根据去年的数据,a12内核的时钟频率约为2500mhz,但性能计数器测量的确切数字似乎是2514mhz。同样,a13的大内核时钟应该比其估计的2666mhz时钟高几mhz。

小效率内核的时钟频率提高了8.8–12.3%,最高频率约为1728mhz。这是一个很好的改进,但重要的是,当更多小内核处于活动状态时,它们不会降低时钟频率。

Anandtech进一步指出,这一代大内核被称为“闪电”,是去年涡流微体系结构的直接继承者。在他们看来,新核心与去年的核心在核心设计方面没有太大不同,至少在正常执行单元方面是如此。微体系结构的核心仍然是一个7宽的解码前端,配有一个非常宽的执行后端,有6个alu和3个fp/vector流水线。

因为闪电和漩涡在很大程度上是相似的,anandtech认为苹果并没有对执行后端做任何实质性的改变,但是值得注意的是,它复杂的整数流水线确实在这里有所改进。这里,两个乘法器单元可以将一个周期的延迟从4个周期减少到3个周期。整数吞吐量也得到了极大的提高,因为吞吐量现在翻了一番,延迟/最小周期数从8个减少到了8个。七个周期。

在缓存方面,苹果似乎保留了a12漩涡内核的缓存结构。这意味着我们有8个关联的128kb l1指令和数据缓存。数据缓存保持非常快的速度,负载使用延迟为3个周期。内核间共享的l2缓存继续保持8mb的大小,但苹果公司已经将延迟从16个周期减少到14个周期。

在新闻发布会上,我们记得苹果推出芯片时,提到cpu核心的一个重大变化是苹果将“机器学习加速器”集成到微体系结构中。本质上,它们似乎是带有类似dsp指令的矩阵乘法单元。苹果公司已经将其性能提高到1tb操作(top)吞吐量,声称比传统的矢量流水线提高了6倍。根据anandtech的分析,amx指令集似乎是运行在cpu内核上的arm isa的超集。

关于这意味着什么,人们有很多困惑,因为它直到现在才广为人知,允许arm体系结构的许可证持有者用定制指令扩展他们的isa。我们无法从苹果或arm获得任何确认,但很明显,苹果没有向开发者公开披露这些新指令,而且它们也没有被纳入苹果的公共编译器。然而,我们知道苹果内部有编译器,acclerate.framework等库似乎能够利用amx。

Rm最近披露了向厂商提供定制指令以实现和集成到arm内核的证据,这显然足以证明架构授权厂商可以自由地做他们想做的事情——苹果选择隐藏amx指令至少可以解决对可能的isa的软件碎片问题。

Cpu核心:重大升级

苹果的小型高效内核非常有趣,因为与arm的典型小型内核(如cortex-a55)相比,它们并没有那么小。去年,a12中的tempest效率内核是基于一个三画面无序微体系结构,其中两个主要执行流水线与l/s单元一起工作。我们假设这是一个专用单元。

今年的迅雷微体系结构似乎对高效cpu内核做出了重大改变,因为我们看到新内核的执行能力有了实质性的提升。就整数alu而言,我们似乎仍在寻找两个单位,但苹果已经将能够设置标志的单位数量从1增加到2倍。Mul吞吐量每个周期保持1条指令,除法单元似乎也没有变化。

从新a13雷霆内核的性能来看,我们可以看到新的微体系结构大大提高了ipc,specfp工作负载的浮点性能也提高了34-38%,从403.gcc的19%提高到400.perlbench的38%。

在其他方面,我们看到一些性能下降,因为苹果改变了内存子系统的dvfs策略,这阻止了效率内核触发一些内存控制器的更高频率性能状态。这让我们看到了一些奇怪的结果,比如470.lbm。

新内核的能效也显著提高。当然,这些改进中的一些将归因于系统内存运行速度慢,但是考虑到内核在spec suite中仍然可以提供10%到23%的平均性能,它仍然给人留下能耗降低25%的深刻印象。平均而言,它还指出了主要的效率提高。

面对闪电核心(amx除外)相对保守的变化,新的闪电核心似乎是a13的一个激进而巨大的变化,与苹果过去的效率核心微架构有着显著的不同。与snapdragon 855等cortex-a55实现相比,新款迅雷内核的性能领先2.5-3倍,但功耗不到一半。

Spec2006性能:桌面级

由于我们在大型闪电cpu内核的微体系结构中没有看到太多显著变化,因此我们预计性能不会比a12有显著提高。然而,由于内存子系统和核心前端的改进,时钟频率增加了6%,而ipc增加了几个百分点。因此,它能够并且确实带来大约20%的性能改进,这与实际情况相一致。苹果正在做广告。

我仍然想暂时回到spec2006,因为我没有时间移植和测试2017年的移动设备。

在specint2006中,性能改进分布相对均匀。平均来说,我们看到性能提高了17%。最大的收入来自471.omnetpp和403.gcc,它们受到延迟的限制,这给缓存带来了更大的压力。这些测试分别增加了25%和24%,这是非常显著的。

虽然性能数据非常简单明了,这并不奇怪,但另一方面,功率和效率数据却出乎意料。在几乎所有2006年的测试中,苹果采用了a13 soc,并提高了峰值功耗。因此,在许多情况下,我们比a12高近1w。这里,当性能达到峰值时,功率增加似乎大于性能增加,这就是为什么a13在几乎所有工作负载中都不如a12有效。

总的来说,a13和闪电核心的性能非常快。在移动领域,几乎没有竞争,因为a13的性能几乎是第二好的非苹果soc的两倍。在浮点封装中,两者之间的差异较小,但类似地,我们必须再等2-3年才能期待任何合适的竞争,苹果也不会停滞不前。

去年,我注意到a12不如最好的桌面cpu核心。今年,a13至少是amd和英特尔在specint2006上能提供的最佳匹配。在specfp2006年,a13仍落后约15%。

对于令人震惊的功率数字,一个可能的解释是,对于a13,苹果在新的闪电核心的峰值频率处在频率/电压曲线的远端。在上图中,我们去年估计了a12的功率曲线——在这里,我们可以看到苹果非常保守,它的电压高达最后几百兆赫。对于a13,苹果在随后的频率状态下可能更具侵略性。

这个假设的好消息是,平均而言,a13应该在日常工作负载中以更高效的运行点运行。苹果的营销材料使a13的速度提高了20%,同时指出它比a12耗电少30%。不幸的是,这种说法具有欺骗性(或者至少不清楚)。虽然我们怀疑许多人会认为a13速度增加了20%,而同时使用的功率却减少了30%,但这实际上是其中之一。事实上,这意味着a13的能耗将在相当于a12峰值性能的性能点降低30%。考虑到苹果公司功率曲线的陡度,我很容易想象这是准确的。

系统和ml性能

在研究了新a13的cpu性能之后,是时候在一些系统级测试中看看它的性能了。不幸的是,仍然缺乏适当的ios系统测试,这尤其令人沮丧,尤其是当涉及到pcmark等测试时,它可以更准确地表示应用程序用例。相反,我们必须回到基于浏览器的基准测试。浏览器性能仍然是设备性能的一个重要方面,因为它仍然是主要工作负载之一。当显示性能特征(如性能延迟(如响应时间))时,它会给cpu带来很大压力。

像往常一样,以下基准测试不仅指示硬件功能,还指示移动电话的软件优化。在我们的测试中,ios13再次将基于浏览器的基准性能提高了约10%。我们用ios13上的新分数更新了上一代iphone的性能数据,以便对新款iphone 11进行正确的苹果-苹果比较。

在速度计2.0中,我们看到新款a13手机的性能比以前的iphone xs和a12提高了19-20%。这一增长符合苹果的性能要求。今年的增长比我们去年使用a12时看到的要小,因为去年分数的主要增长似乎是升级到128kb l1i缓存。

与a12相比,a13在达到大闪电核心的最大时钟速度所需的时间上变化不大,而cpu核心在100 ms以上达到峰值。

真正改变的是工作负载停留在较小的雷电效率内核上的时间。在a13,小核心的爬升速度比a12快得多。调度程序行为和工作负载从小内核到大内核的迁移也发生了重大变化。现在,在a13上,这大约发生在30毫秒后,而在a12上,可能需要54毫秒。由于小内核不再能够单独请求更高的内存控制器性能状态,因此是时候在更高的工作负载要求下尽快迁移到大内核了。

a13的避雷针从大约910mhz的基本频率开始,比a12和1180mhz的基本频率稍低。这意味着苹果已经将a13大内核的动态范围扩大到更高的性能和更低更高效的频率。

机器学习的推理性能

苹果公司还声称已经改进了a13中神经处理器ip模块的性能。要使用此模块,您必须使用coreml框架。不幸的是,到目前为止,我们还没有一个定制的工具来测试它,所以我们不得不依赖一个罕见的外部应用程序来为它提供一个基准,那就是陆大师的aimark。

像网络浏览器的工作量一样,ios13也给过去的设备带来了性能上的改进,所以我们重新运行iphone x和xs分数,以便与新的iphone 11进行适当的比较。

iphone 11和新a13的改进取决于型号和工作量。对于经典模型,如inceptionv3和resnet34,我们发现推理率提高了23-29%。Mobilenet-ssd的有限增长率为17%,而deeplabv3的增长率为48%。

一般来说,运行机器学习基准的问题是它们运行在抽象层(这里是coreml)。我们不能保证有多少型号的npu实际上运行在cpu和gpu上,因为根据设备的ml驱动程序,它们之间可能有很大的差异。

然而,a13和iphone 11在这里非常有竞争力,为这一代人提供了良好的迭代性能。

总的来说,iphone 11s性能卓越,因为我们一再期待苹果。话虽如此,我不能说我在日常使用中与iphone xs有太大的不同。因此,尽管a13提供了一流的性能,但去年a12设备的用户可能不会很注意到它。老式设备会带来更多的影响。否则,有了如此强大的功能,我认为用户体验将会从加速应用程序和系统动画的选项中受益匪浅,甚至完全关闭它们来真正感受硬件的平滑性。

Gpu性能和功耗

我们已经详细介绍了a13 cpu,gpu也是不可忽视的一部分。苹果今年对该部门的表现更加保守。该公司承诺在与a12相同的性能下,将gpu性能提高20%,或将功耗降低40%。

除了芯片组和gpu的原有性能之外,游戏的重要意义还在于实际设备的热特性以及如何耗散和保持soc的高热。对于a12,我确实批评苹果,因为它非常积极地允许手机开始使用3d工作负载的峰值功率。这导致手机在减速前无法真正保持这些性能水平超过2-3分钟。

今年,苹果公司宣布已经提高了设备soc的冷却能力,以更好地将热量从soc分配到手机主体,从而保持芯片处于更高的性能状态。

从3dmark中的物理测试开始,事实上,当gpu工作负载期间功率受限时,这实际上是更多的cpu工作负载。在这种情况下,与去年的iphone相比,iphone 11在峰值性能方面表现更好,但它们不能完全保持与a12 iphone相同的持续性能。

切换到图形工作负载给gpu带来最大压力,我们现在看到分数和排名发生了显著变化。首先,新款iphone 11s和a13现在比去年的a12设备表现出显著的性能提升。我注意到,当我们分析芯片时,苹果在3dmark上的表现异常糟糕,苹果似乎可以解决这一代的任何瓶颈,性能提高38%。事实上,我已经转身在ios13上快速测试了iphone xs。与我们在该图中看到的相比,我确实看到了20%的性能提升。

新款iphone的得分低于snapdragon 855()设备,但这是因为苹果不允许iphone产生几乎与其他设备一样多的热量。我无法在任何新iphone上测量41°c以上的场景。

通过测量功耗,我们再次看到a13设备的峰值功率非常大,超过6.2w..有趣的是,即使在功耗达到峰值的情况下,a13也比a12高效,比竞争对手高效得多。

通过一系列测试,anandteh指出,去年a13的gpu性能是同类产品中最好的。他们说,去年a12在gpu方面取得了令人印象深刻的进步,这是苹果第一次能够在性能和效率方面显著领先高通。

首先,a13的峰值性能确实提高了约20%。然而,这不是一个人们应该最关注的指标。与去年的iphone相比,苹果的持续性能得分显著提高,达到50%至60%。看来苹果公司关于改善soc散热性能的主张非常好。

最重要的是,苹果a13上的新gpu微体系结构令人印象深刻。鉴于流程节点的开发微不足道,我没想到公司能够推动如此大的性能和能效提高。我们需要看到竞争对手的一些主要型号变化,以便他们能够赶上下一代设备。

*点击文章末尾阅读原文,原文可以用英文阅读。

*免责声明:这篇文章最初是作者写的。这篇文章的内容是作者的个人观点。重印半导体行业观察只是为了传达不同的观点。这并不意味着半导体行业观察同意或支持这一观点。如果您有任何异议,请联系半导体行业观察。

今天是2100期《半导体工业观察》。请注意。

半导体工业观察

“半导体第一垂直介质”

实时专业原始深度

人工智能|射频| |eda| |晶圆| |cmos|dram| |集成电路|英特尔

回复文章并阅读“如何成为“半导体工业观察”的成员”

回复搜索,你可以很容易地找到你感兴趣的其他文章!

你可能会喜欢:

专题

聚焦全球黑科技“互联网之光”博览会在乌镇开幕

聚焦全球黑科技“互联网之光”博览会在乌镇开幕

回到顶部