首页 > 智能网

阿里第一颗芯片 平头哥端云一体全栈产品初步成型

来源:智能网
时间:2019-09-25 18:02:57
热度:62

阿里第一颗芯片 平头哥端云一体全栈产品初步成型在9月25日的阿里云栖大会上,达摩院院长、阿里巴巴CTO张建锋现场发布了含光800AI芯片,这是阿里巴巴第一颗自研芯片。含光800被认

在9月25日的阿里云栖大会上,达摩院院长、阿里巴巴CTO张建锋现场发布了含光800AI芯片,这是阿里巴巴第一颗自研芯片。含光800被认为是全球最强的AI芯片,在业界标准的ResNet-50测试中,含光800推理性能可以达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。

阿里第一颗芯片 平头哥端云一体全栈产品初步成型

2017年的阿里云栖大会上,阿里达摩院正式成立;2018年的云栖大会上,平头哥半导体公司正式成立。随后,在2019年7月,平头哥正式发布首款CPU芯片玄铁910,号称是目前业界性能最强的一款RISC-V处理器。玄铁910可以用于设计制造高性能端上芯片,应用于5G、人工智能以及自动驾驶等领域。一个月后,平头哥在8月发布SoC芯片平台“无剑”,打造面向AIoT时代的一站式芯片设计平台,提供集芯片架构、基础软件、算法与开发工具于一体的整体解决方案。

在含光800发布现场,张建锋说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”

与玄铁一样,含光同为上古三大神剑之一,该剑含而不露,光而不耀,官方称这正如含光800带来的无形却强劲的算力。

根据阿里云展示的杭州城市大脑的业务测试,1颗含光800的算力相当于10颗GPU。实际应用上,含光800目前已开始应用在阿里巴巴内部核心业务中。根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。

而含光800性能的突破得益于软硬件的协同创新,张剑锋表示,尽管现在很多厂商都在打造芯片,但它们只是在做硬件,而阿里则在提供一个软硬兼备的创新平台。以含光800为例,其硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对CNN及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。

未来,含光800将通过阿里云对外输出AI算力。张剑锋宣布,基于含光800的AI云服务从9月25日起正式上线,而且相比传统GPU算力,起性价比将会有100%的提升。

而随着玄铁910、无剑SoC平台、含光800的发布,张剑锋表示,平头哥端云一体全栈产品系列初步成型,已经涵盖处理器IP、一站式芯片设计平台和AI芯片,实现了芯片设计链路的全覆盖。

Baidu
map