华为发布全球首款移动端AI芯片麒麟,它将如何打开手机新世界?

华为这家企业,你不服不行。

华为发布全球首款移动端AI芯片麒麟,它将如何打开手机新世界?

昨天晚上,从德国传来好消息,风传已久华为自家全新一代手机Soc处理器——麒麟(Kirin)970芯片正式发布。更重要的是,它同时还是第一款带有AI的手机芯片。

而搭载麒麟970的全新旗舰手机Mate10系列,将在今年10月16号在德国慕尼黑正式发布。

麒麟970

究竟麒麟970强在哪里?华为凭借麒麟970又能打开怎样一个手机新世界?且听AI科技评论为你解释一番。

新加入的NPU,究竟是个什么东西

作为本次麒麟970的最大看点,NPU最受到大家关注。

NPU实际上是“Neural-network Processing Unit”的简写,翻译过来就是“神经网络处理器单元”。我们现在耳熟能详的各种人工智能能力,大部分都是依靠对人类大脑的部分模拟实现的,即神经网络运算。

寒武纪板卡

寒武纪板卡

AI科技评论了解到,这颗NPU并非华为独立打造,技术方面主要由国内AI芯片创业公司寒武纪负责。后者去年已经发布了第一款深度学习专用处理器“寒武纪1A”,同时还为其配套了专用的指令集系统。就在两个星期之前,寒武纪还完成了A轮融资,总金额达到1亿美元,融资方包括国投创业、阿里巴巴、联想等一批知名巨头和VC。

所以NPU是专门为了人工智能而生,根据官方现场PPT,这颗NPU的性能将达到1.92T FP16(半精度浮点运算)。相比之下,经常拿来作为神经网络研究的NVIDIA GTX1080,FP32的处理能力为8.87T。由此换算,GTX1080的FP16能力大约为17.74T。

换句话说,NPU的性能约等于1/9个GTX1080。

因为专用,NPU在性能强大的同时,还拥有极佳的功耗表现。华为官方也给出了4个比例:NPU的性能6.25倍于CPU、4倍于GPU;NPU的效能50倍于CPU、6.25倍于GPU。

华为还给出了一个实际的应用场景表现,在用NPU识别1000张图片的过程中,NPU的整体功耗只在0.3-0.7W之间浮动,实际的电池消耗仅为0.19%(4000mAh电池)。换句话说:如果电量充足,NPU完全可以利用一块电池实现50W张照片的识别。

NPU在专用场景中的性能表现可见一斑,但专用处理器并不只是靠硬件就能运作,华为此次也同时发布了自己的开放AI平台,专门搭建具体应用到CPU、GPU、NPU等硬件处理器之间的“桥梁”,这也是NPU能够发挥性能的前提条件。

从发布会上的信息来看,这套AI平台主要有两层:第一层由Google自家的API Android NN(Neural Network,神经网络)、华为的Kirin AI API组成。第二层则是Kirin AI Heterogeneous Resource Management(麒麟混合资源管理)和其他Runtime方案组成。

从整体布局上来看,华为并不想单纯依靠于Google官方的工具,而是希望通过向开发者开放,进而彻底将华为的硬件能力释放出来。

华为在发布会上也稍微展示了一下这套架构的威力,在2000张图片识别的基准测试中,麒麟970取得了2005的分数,相比之下依靠CPU的三星S8只有95分,而在GPU调用方面比较出色的iphone也只不过487分。更多芯片解读:www.yangfenzi.com/tag/chip

在发布会之上,华为也宣布了相对应的AI生态举措。主要包括开发网站、麒麟AI开发套件、应用市场三块。利用华为全线资源扶持这个生态的趋势,显而易见。

麒麟970详细介绍

麒麟970详细介绍

说完NPU,我们再回头来整体看看麒麟970,先放一张规格:

  • 制程:TSMC(台积电)10nm;
  • CPU:4个A73 2.4GHz + 4个A53 1.8GHz;
  • GPU:Mali G72MP12(12核);
  • NPU(新增AI处理器):1.92T FP16 OPS;
  • Image DSP(图像专用处理器):512bit SIMD;
  • Modem(基带):1.2Gbps@LTE Cat18;
  • 内存:LPDDR 4X;
  • 存储:UFS 2.1

….

我们先从制程看起,麒麟970选择了全新的TSMC 10nm工艺。在这一点上,970看齐去年年底的骁龙835,后者选择了三星的10纳米工艺。

因为新制程的关系,麒麟970相比上一代960将会有20%的功耗降低,同时在封装尺寸上还将缩小40%。但实际上,970再次刷新了麒麟系列芯片中晶体管数量的记录——55亿个晶体管,远超上一代麒麟960的40亿个。相比之下,骁龙835只有30亿,苹果iphone7系列使用的A10处理器也不过33亿个。

但实际上,这次970的CPU部分是“不思进取”的。8个核心的组成方式(4个A73+4个A53)、8个核心对应的运行频率,实际上与麒麟960完全一致。

真正的改变主要集中在GPU和NPU上。GPU采用了全新的Mali G72MP12。这也是手机首次用上12核GPU。而就其组成Mali G72图形处理器单元来说,相对于上一代麒麟960的G71图形处理器单元来说,并没有大幅度的性能提升。所以按此估算,麒麟970的图形处理性能大约会接近960的1.5倍。

在拍照方面,麒麟970采用了两个ISP,在拍照这一应用场景中取得了很大进展:更快的反应速度、更快的对焦速度、运动拍摄帧率更大、暗光场景下的拍摄能力更强。

最后是网络,华为在麒麟970之上,再次扩宽了4G基带频率范围,同时还支持最先进的4.5G LTE技术。在极限条件下,整体带宽最高能达到1.2Gbps。

正在打开手机新时代的华为

看到这里,或许还有很多人并不理解:麒麟970是更强了,但为什么说它正在打开手机新时代的大门?

这一点我们要倒回手机这个应用场景本身去看,在去年的WWDC16之上,苹果就为iOS 10中的“照片”提供了一个功能:照片应用会自动根据地点、主题等将照片归纳分组,除此之外,它也能将内部的一些相关资源组合,生成一些“回忆合集”。这种东西在原来都是不可想象的。

很明显,如何利用人工智能释放出更多功能、更多能力,已经成为手机发展的下一个战场。

就拿去年红极一时的Prisma来说,这款能够将各种照片变成“名画风格”的应用一开始它选择的是将照片上传到服务器处理,但随着用户的数量不断增加,处理速度也变得越来越慢。直到去年年底Prisma开始在iPhone上面开始调用本地GPU来处理,往往能够在2s内完成处理,同时还不受网络好坏的影响。这样的新体验是“革命性”的。

正如余承东在发布会上列举的那样,我们不远的将来或许能够实时使用计算机视觉分析街道、能够在低功耗的前提下使用AR、翻译之类的应用也将变得更加准确。

对于为手机端添加AI能力的持续影响,华为其实也做了思考。除了上面提到的这种革命性改变之外,隐私问题同样重要。之前我们经常将数据上传到云端去处理。上传到云端的数据是否会泄露?是否会被违法使用?完全依赖云端或者本地的数据其实都不可行。

完美的解决方案应该是把隐私的数据本地处理,不隐私的数据云端处理,进而兼顾隐私和能力,让用户能够最大程度获得人工智能带来的改变。

功耗同样重要,在体积有限、电池技术短期无大突破的前提下,造“电老虎”并没有实际意义,因为专业软件底层、调用、硬件的配合,手机对于处理人工智能需求也会变得高效。进而确保了手机能够持续输出革命性的体验。

将这些趋势组合起来,其实可以很容易得到解决方案,但这件事之前实际上几乎只有苹果在做。

一方面是因为苹果自己采用了相对封闭的生态,在技术实现上相对适应性强一些。第二个是全新技术加入,同样需要大量资金和人力的投入,“富可敌国”的苹果自然不缺那些。最后是借助外力,只有整个生态完善了,才可能持续不断地为消费者创造新体验。

这件事,按照对位来说,本来应该由Google完成,但Google本身的纯软件定位和现有的手机硬件市场,注定依赖Google并不靠谱。自己做,几乎是唯一靠谱,但又需要大量勇气的方法。

华为

就已经在手机核心模块中初步打造出AI能力的华为来说,已经迈出了最重要的前几步,如何在此基础上继续培育生态、开发更多全新的手机功能,为消费者带来全新体验,这依旧是个很大的挑战。

挑战归挑战,还是得给华为的勇气和远见点个赞。(文/ 李赓  AI科技评论)

·氧分子网http://www.yangfenzi.com)延伸阅读:

➤ 中星微集团创建人 星光中国芯工程总指挥邓中翰:情定“中国芯”

➤ 百度公开硬件基准DeepBench,推动深度学习专用芯片研发竞争

➤ 英特尔与英伟达的AI芯片争霸战一触即发,京东给出了一个选择

➤ 后 ImageNet 时代:李飞飞视觉基因组重磅计划,新一轮竞赛!

➤ 葛甲:计算机视觉识别,比我们想象得要美

➤ 孟晚舟清华披露华为发展密码:勇敢不是不害怕,而是心中有信念

氧分子网(www.yangfenzi.com)是关注互联网生态圈的科技新媒体

·氧分子网http://www.yangfenzi.com)综合整理

分享给您的好友:

您可能还喜欢…

发表评论

电子邮件地址不会被公开。 必填项已用*标注

您可以使用这些HTML标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>