"天下大势,分久必合,合久必分",M1并不是苹果第一次改换处理器,早在2005年,Mac系列就从摩托罗拉、IBM的Power系列处理器更换到英特尔酷睿处理器。
在当年的WWDC上,乔布斯谈到了对Power处理器的失望:性能不足、开发路线模糊且功耗巨大,而这正是改换门庭的契机。
而当我们把时间线拨到15年后的今天,你会发现历史总是惊人的相似,眼下的英特尔也正经历着性能、制程研发和功耗的瓶颈煎熬,所以,苹果推出应用于Mac系统的自研处理器其实一点儿也不让人意外。
虽然我们在电脑端习惯于说处理器,但注意,M1是苹果第一款专为Mac设计的SoC芯片,
关键词:SoC。这正是M1最大的技术基础,接下来我们将会以此为起点并结合新款Mac mini的实际测试,来为大家揭开M1的真实用户体验是否如坊间传闻那般"拳打i9,脚踢PC"吧。
单核性能极强,非专业用户日常使用OK正如前面所说,M1推出的契机在于X86架构处理器在肉眼可见的未来,并不具备苹果想要的进步幅度,也与苹果期望的发展方向相左,作为手握手机平板端最强SoC的苹果早已打造了属于自己的闭源生态圈,所以在Mac上完全可以移植这套"熟悉的配方",掌握最高级别的供应链话语权。
但实现这一目标必须有一个大前提,那就是性能要足够强,至少要在用户端实现无感迁移,那M1是怎样做的呢?
首先是CPU单核性能的极致优化,一直以来苹果的SoC都是走相对低频+少核心数量+超宽架构IPC方案,M1也不过是4大核设计,但在采用台积电5nm制程下足足塞入了160亿个晶体管,4个大核可以分配到非常充裕的晶体管资源,先天就相对X86竞争对手有着明显的单核性能优势。
在Geekbench 5测试中,单核可以跑出惊人的1732分,作为对比,单核睿频最高可达5.1GHz的英特尔Core i7 10875H只能跑1100分出头,即便是放眼桌面端最强的Core i9 10900K也最多只能逼近1500分,与M1仍存在较大的差距。
从程序优化的角度来说,调用的核心越少,工作效率就越高,所以单核性能基本决定了综合体验的下限,M1在这方面可以说留足了性能空间,并且在跑Geekbench 5 CPU测试时,CPU占用率在45~65%之间,平台峰值功耗也不过28W,整机运行非常安静,机身外壳也基本没有发热。
换言之,即便是单纯比通用计算性能,M1也并不会比X86同功耗水准的型号差,甚至在对比英特尔11代低电压型号时能占得先机,但相较AMD 4000U系列还是有一定的差距。
除此之外大家最关心的可能还是软件兼容性的问题,毕竟ARM和X86存在架构区别,"我买M1芯片的Mac会不会用不了已经习惯了的macOS APP呢?"
M1的特殊之处在于需要应用开发商针对Universal进行升级后才能以ARM原生方式运行APP,但好消息是我们日常使用的大多APP,比如QQ、爱奇艺、WPS、剪映等国产APP都基本在第一时间推出了Universal版,可以很方便地在APP Store进行下载安装,因此,日常工作娱乐M1芯片Mac都能很好地实现兼容,可放心选择。
但对于相对专业的应用来说,现阶段来看兼容性问题确实是存在的,因为目前Mac用户仍习惯于通过浏览器下载而不是通过APP Store,所以很容易下载到无法支持的版本(当然,很多第三方大型专业软件本来就无法通过APP Store)。
因此,M1芯片的Mac系统还是更适合原本就一直使用苹果系第一方APP的用户:Final Cut Pro就第一时间进行了原生适配,但比如像Adobe旗下的热门软件就没有那么快了,最快的Lightroom CC也要12月,Photoshop则要到2021年,Premiere、After Efftct、Illustrator等暂时没有公布时间线。
虽然macOS Big Sur包含了Rosetta 2编译器,运行可受支持的X86 Mac APP时会提示下载安装,但它的限制也很明显:使用AVX/AVX2/AVX512指令集的软件无法编译,但这恰恰是生产力软件的必备。
除此之外,虚拟化X86的软件和涉及到内核模块也无法翻译,限制比较明显。而且WWDC 2020现场演示的PD虚拟化Debian 10并不是大家以为的X86版本,而是树莓派的Lunux版……
综上所述,短时间内对于需要在虚拟机环境下开发、使用第三方大型设计软件的用户来说,M1芯片机型入手还需谨慎。
大量专用芯片保证了高性能及低功耗回到硬件功能上,作为以SoC形态出现的电脑处理器,M1相对传统X86 CPU的优点在哪呢?先来看传统CPU是怎样处理数据的吧,现代CPU支持数百条指令,但仅仅只处理一个寄存器的数据也需要完整地跑一遍流水线,但即便是流水线较短的ARM架构也在10级以上,X86则需要经历20级左右,能效比很低。虽然现代CPU大多可以将常见的指令集合,一次下达1条指令就能实现多个指令的并行,一条指令也可以同时处理多组数据以实现单指令多数据流,但即便是AVX512的带宽依然相对太窄,再加上长流水线的影响,所以为了提高性能就只能提高频率,这也就增加了功耗,这就是为什么低电压x86 CPU很难成为生产力工具的原因。
既然CPU的通用计算能力如此有限,M1的方案方向就很明确了,那就用上专用计算方案吧。于是在M1的官方结构图上,我们可以看到非常多的专用芯片:图像处理、视频编解码、音频处理、加密解密、神经网络……
所以,这其实与手机/平板芯片是同一个路数,通过不走CPU流水线的专用芯片将能耗比最大化,进而实现高效与低功耗的兼备。
那么,专用芯片的性能到底有没有说的这么厉害呢?
如果你经常使用Premiere或After Effect等视频剪辑/特效软件,一定会对高分辨率素材回放所造成的卡顿印象深刻,哪怕你电脑配置价格过万也无法避免,所以有时候为了提高工作效率,不得不依靠调低预览分辨率甚至使用*****来解决这个问题。
但这又意味着无法直观检视色彩、细节、动态范围等关键数据,如果再遇上H.265编码甚至HDR内容,说它是视频工作者的梦魇也不为过。
而结合专用芯片的M1表现如何呢?
我们在Final Cut Pro 10.5中调用了数段8K分辨率素材建立视频项目,并以"较好质量"进行实时回放,无论怎样拖动时间线,预览画面与时间线指针都能即时响应,并且在调整颜色、饱和度、曝光数据并小幅度裁切后也同样可以零卡顿预览,不需要单独渲染,这在传统X86处理器机型上是很难实现的。
除此之外,在编辑iPhone 12 Pro Max拍摄的4K分辨率60帧Rec 2020色域H.265编码HDR视频时,M1芯片加持的Mac mini也能做到完全流畅的回放和剪辑,并且平台功耗可以控制在15W以内,CPU/GPU占用率也很低。
我们把这一段视频放到采用Core i7 10875H处理器、32GB内存、RTX 2070独显的Windows 10笔记本上使用Premiere Pro 2020进行编辑,在开启硬件加速的情况下也同样会出现卡顿。而且平台功耗轻松超过80W,内存更是几乎吃满,由此可见,在受支持的APP下,专用芯片的功能十分明显。
同样的结论也适用于包括机器学习、数据加密、音频编码等其他专用芯片加速的项目,比如在djay Pro AI音频剪辑软件中,M1就能准确识别乐曲中的节拍、鼓点和人声并支持各自分离重新混音,相对Windows平台的音频后期软件来说准确率要高很多,并且通过滑条的方式进行控制也很直观。
当然,有受支持的APP就有不受支持APP,如果是通过Rosetta 2编译后运行的第三方X86设计软件,因为没有专用芯片来进行硬件优化,所以工作效率跌幅明显。
以Blender为例,使用最新的稳定版2.90.1进行云雾效果渲染,因为CUDA、OpenCL、OptiX等硬件加速都无法开启,因此即便平台功耗跑到了30W左右、CPU占用率100%、GPU超60%这种接近满载的情况下,渲染效率依然很低。
在我们的Windows 10对比平台上,相同设置的渲染效率明显要高出很多,这就是此前提到的问题所在:当面对没有专用芯片优化、且并未通过Universal实现原生的第三方高负载APP时,M1的表现会很受限。
打破性能桎梏的片上封装内存设计内存性能可以简单分为带宽和延迟两个维度,如果马力全开,一个3GHz的4核CPU在执行两个256bit单指令多数据流FMA指令时,数据带宽的需求是约为2304GB/s,即便是双通道DDR4-3200内存的带宽也只有51.2GB/s。
当然,实际应用中除了特殊的测试程序之外,不可能出现全速吞吐FMA指令集的情况,但这个差距依然是十分悬殊,仍有填补的必要。
所以,现代CPU一般会在内核放入大容量缓存来解决这个问题,三级缓存的带宽是内存的7~8倍,延迟则只有1/5,效率显然更高。但缓存占据了大量的内核晶体管资源,不可能无节制地增大。
而M1给出的解决方案则退了一步,通过SoC的形式将2颗LPDD44X DRAM直接封装到M1的基板上,这样一来,至少相对传统的插槽或主板焊接而言走线距离短了非常多,进而降低了延迟并降低功耗。
根据已有的资料来看,相对板载方案,传输功耗的下降幅度可以达到20倍之多,未来如果能结合HBM2内存颗粒,双通道的情况下就能实现512GB/s的带宽,足足是DDR4-3200的10倍。
不过,封装内存也就意味着完全舍弃了扩展性且容量上限也明显更低,这就会形成天生的用户群上限。3款采用M1芯片的Mac产品最大内存容量也不过16GB,macOS可不能像iOS这样通过杀进程的方式来缓解内存压力,并行是电脑操作的自然属性,所以这就注定了至少在M1这个阶段,它依然只能在主流定位的产品上找存在感。
但从商业角度来说这个切入点反倒很适用,因为主流即代表高出货量,这是生态形成和用户习惯培养的根本,M1必须能打下这个基本盘,ARM在Mac端才能走得更远。
为什么我们选择测试Mac mini
?M1芯片的3款机型中,大家可能更关注新款的MacBook Air和MacBook Pro,不过我们知道CPU的性能往往与散热正相关,相对于以轻薄为主要设计方向的笔记本而言,Mac mini虽然定位迷你,机身只比机顶盒大不了多少,但"瘦死的骆驼比马大",厚度依然足足有36mm,是MacBook Pro的两倍有余,这就为它的散热设计保留了足够的余量。
事实上从我们的测试来看,即便是运行需要编译器编译的X86高负载应用也没有出现明显的噪音,机身发热也几乎可以忽略,所以Mac mini是3款M1芯片机型中性能释放最稳定的一款。
而且作为不需要负担屏幕、键鼠成本的迷你台式机,Mac mini也将用户预算压力控制在了最低水准,可以充分利用已有的或自己更喜欢的周边硬件来展开工作,视频输出可以通过HDMI2.0和1个带宽达到40Gbps的雷雳/USB4来实现双显示器。
除此之外还有1个雷雳/USB4接口,并预留了2个USB-A、千兆有线、3.5mm音频输出并支持WiFi6无线协议,对于大多数想要尝鲜更换Mac平台的用户来说,也是目前最实用的方案。
当然,如果是重度外设用户,接口数量还是相对紧张的。
采用基于ARM架构的电脑处理器方案,也意味着完全打通了iOS和iPadOS生态,毕竟这两者在各自领域都基本上稳坐头把交椅。
M1的出现开启了苹果电脑、手机、平板生态大一统的开端,未来的走势就是APP端有着广泛的三者兼用基础,上层再发展出各自特化的APP来作为延展区分,这就是苹果力推M1的市场目的,也是为啥总有人说M1就是强化版A14Z的原因,其实这种说法在我看来确实是有理由的。
将手机、平板、电脑的处理器统一的另一大优势,就是可充分利用规模效应来降低成本,即便是作为第一代产品的M1也已借由iPhone和iPad庞大的体量收获了低成本效益。
与采用Core i5处理器的版本相比,同为8GB内存、512GB SSD的配置下M1版Mac mini足足便宜1500元,但基本的日常使用来看几乎没有差别,还能依靠专用芯片来给苹果系APP加上强力Buff,可以说是优点很明显的产品。香!
机智猫专注数码科技,关注我,一起测新机、聊行业、学技巧