分享

自研AI芯片出手就是全球第一,阿里为什么能赢在起跑线

 好书风 2019-09-25

文/观察者网专栏作者 龙科多

在9月25日的杭州云栖大会上,阿里正式发布了首颗芯片含光800,这款芯片在推理性能和能效比上均为全球第一。

在人工智能与物联网深度融合的AIoT时代,阿里头哥近三个月打出了三款产品的组合拳。

以金庸小说笔下第一神剑玄铁命名的玄铁910,采用开源架构RISC-V,主打物联网终端设备。

命名同样源自金庸小说,表达“无剑胜有剑”武学境界的无剑SoC平台,是一站式芯片设计平台,涵盖CPU、GPU等,意指无芯片却有平台,能帮助各路芯片设计企业“铸剑”。

而最新发布的含光是最强AI芯片含光800,含光为上古三大神剑之一,该剑含而不露,光而不耀。

含光800已经大规模应用于阿里内部场景,例如视频图像识别/分类/搜索、城市大脑等,降低阿里巴巴经济体整体计算的成本,但含光800并不以芯片的形式对外售卖,在阿里云数据中心里,这款芯片将和平头哥未来推出的更多形态AI芯片一起,通过云服务为企业提供算力。

有了这样的组合拳,平头哥端云一体化的方向已经初见端倪。

端云一体,为各行业提供普惠算力,这将是阿里芯片生态的优势所在,平头哥不做卖芯片的公司,而是针对国产芯片生态的短板,选择走“带着大家一起玩”的模式。大量中小企业都试图造一颗自己的芯片,无剑SoC平台和玄铁处理器IP可以帮助企业降低芯片设计门槛;而含光800这些阿里云AI芯片则让企业随时随地享受高性能计算服务,在AIoT这样一个需求、场景、产品将细分、碎片化的时代,这种模式将是一个新的趋势,而单纯卖芯片则难有生态上的突破,可以说,这是“平头哥突围”的尝试。

具体就含光800这个芯片来说,如何评价呢?

软硬件架构上看,自研了架构、软件编译器、框架、工具链等等。

在芯片测试标准平台Resnet-50上的具体分数为:性能78563 IPS,是第二名(15012)5倍;能效比500 IPS/W,是第二名(150)3.3倍。

此次平头哥自研架构的亮点,是可大幅减少对内存的访问,在保证极致性能的情况下,把芯片功耗降到最低水平。

从7个月完成前端设计,之后仅3个月就成功流片的进度看,阿里软硬件的深厚积累,内部场景验证的能力都体现了出来,通常芯片厂商需要多次流片才能成功,到商用更有复杂的过程。后续平头哥推出更多AI芯片,在终端、云数据中心大规模部署,实现端云一体的目标有了保障。

含光800性能的突破得益于软硬件的协同创新,芯片架构方面,含光800采用创新的架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。NPU同时深度优化了卷积,矩阵乘,向量计算和各种激活函数,通过高有效的硬件资源调度和全并行的数据流处理,把AI运算的性能和能效双双推向极致。

当然,阿里达摩院的算法积淀也功不可没。过去两年,达摩院构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果。含光800集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。  

软硬件的协同创新,使这款芯片取得了性能的突破,发挥了含光800芯片的最大价值,相比传统CPU、GPU在深度学习推理任务上优势明显。

根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

上述这些都是含光800的优势,但也许都不算核心优势,因为这些都不足以保证一款NPU的成功,性能、功耗上的比拼,竞品同样可以针对场景和需求做定制和优化,用DSP、GPU跑AI不比NPU差多少的例子也是常有的,什么才是一款AI芯片应该看重的核心优势呢?

笔者认为是应用生态。依靠全球前三、亚太第一的阿里云,平头哥的AI芯片可以在云端轻松抢占企业客户,毕竟,超过一半的中国A股上市公司和80%中国科技类企业在使用阿里云的服务。比较国内受到关注的AI芯片厂商,无论是寒武纪还是地平线抑或是国内其它科技巨头,在这方面都输在了起跑线。

值得一提的是,平头哥处理器IP授权客户超100家,累计销售超十亿颗,广泛应用于机器视觉、工业控制、车载终端、移动通信和信息安全等领域。

而组合拳中的玄铁处理器及无剑SoC平台,也已服务例如人工智能企业云天励飞、老牌芯片商炬芯科技等各行业企业。

利用好这个生态优势,走出自己的生态突围之路,这是笔者对平头哥的建议和期望。在打造端云一体的产品家族上,依托阿里的资源,平头哥做好不难;在芯片、AI和云计算的协同发展上,阿里坚持的战略布局也已经逻辑自洽:人工智能算法逐渐集成到芯片,集成算法的专用芯片为云服务提供更强的性能,而云计算本身则加速人工智能应用的大规模落地。

那么,阿里在生态上虽然领先,是否还有可以进一步去做的呢?

据了解,平头哥正在建设芯片开放社区,但怎么和开源社区竞争,这是采取赋能的路径与开源的路径必然要面临的一个差异。阿里选择云服务和IP授权的路径,那么在社区的建设上就要找准配合的用力点,重点不是技术的分享,而是帮助客户找到合适的应用场景,是教中小企业做AI应用的创新,甚至需要孵化一些这样的创业公司作为用好阿里云算力的范例。

阿里拥有横跨电商、金融、物流、云计算、大数据、全球化等场景,拥有世界上最挑战、最丰富的计算场景、网络场景、机器学习场景,这本身就是最宝贵的数据,将为阿里找到未来的杀手级应用,找到应用创新的示范,帮助、指导创业者用好算力、解决需求作支撑。阿里可以“带大家一起玩”,前提正是大家不会在这样多场景中与阿里全面竞争,更多是需要阿里的支持,有这样得天独厚的优势,阿里完全可以更敞开胸怀,不仅把最好的算力拿出来,更可以建成一所真正的物联网创业学校,因为阿里不怕“青出于蓝”。

笔者相信,作为中国甚至世界上孵化创业者最成功的企业,阿里凭借其经验和积累,在AIoT时代也一定最有机会建设一个物联网创业者的成长平台,阿里做芯片的格局,最终会再次立足于为中国的经济和民生大计,阿里给自己平台的定位,也不会局限在自己的产业,而将瞄准对中国人工智能与物联网社会面貌的改变。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多