芯潮 文 | 心缘
手中无剑,胜在芯。8月29日,阿里平头哥新“剑”出鞘。
这把新“剑”是一站式AIoT芯片设计平台,名字意同武学的至高境界——“无剑”。
现在国内造芯公司起名越来越讲究引经据典,华为几乎承包了《山海经》,紫光新芯片取名为古代皇帝赐予大臣的第六种礼器“虎贲”,如今阿里平头哥的“无剑”典出金庸武侠小说。
话说独孤求败40岁前使用玄铁重剑,40岁后,“草木竹石均可为剑,渐进于无剑胜有剑之境。”
这正是平头哥对无剑平台寄予的厚望,没有芯片,但却能帮各类芯片设计企业锻就芯片。
按照平头哥的介绍,该平台能帮助芯片设计企业,将设计成本和设计周期压缩50%,显著降低定制化芯片的研发门槛,降低效率、提升质量,让企业能更加专注于开发出与应用场景更好融合的芯片产品。
同日,基于平头哥自研玄铁CPU的无剑视觉AI平台问世,已应用到媒体AI芯片、AI视觉芯片、边缘AI服务器芯片等IoT产品中。
发布会期间,平头哥发言人不仅详细解读无剑平台的三大硬核实力和亮点,解答无剑如何与阿里云实现云端协同,而且就AI芯片发展现状、AIoT时代对芯片研发的挑战、阿里平头哥在未来产业扮演的角色等问题一一回应。
经透露,无剑平台采用的是授权模式,不排除未来开源的可能。
另外,在云端,平头哥自研的第一款NPU芯片也将于今年发布,其性能处于业界领先定位,主要用于阿里云数据中心。
一、无剑的三大硬核能力无剑平台由SoC架构、处理器、各类IP、操作系统、软件驱动和开发工具等模块构成,支持第三方AI加速引擎,并包含AI必须的基础软件体系。
它能提供集芯片架构、基础软件、算法与开发工等一体的整体解决方案,能够承担AIoT芯片约80%的通用设计工作量,让芯片研发企业只需专注于剩余20%的专用设计工作。
1、硬件:异构AI加速引擎框架
为了充分发挥各种不同硬件的效能,平头哥打造了一个多场景灵活可配置的异构AI加速引擎框架,允许用户自定义。
平头哥提供神经网络加速库及异构编译器技术,向芯片厂商提供多粒度的硬件抽象接口。
无论是低功耗低成本的语音芯片,还是高性能低时延的视觉芯片,芯片厂商可以根据各种硬件特征,快速对接到AI加速引擎,高效地发挥硬件性能。
该引擎支持当前所有主流框架,几乎所有的标准模型都能够在上面一键部署;它也提供一套便捷的自定义层开发接口,方便开发者多样化需求。
2、应用开发:标准统一的开发框架
平头哥开发了一套标准统一的应用开发框架,同一个应用可以在不同算力的硬件上进行无缝迁移。
据悉,平头哥集成开发环境完美融合该引擎,并添加一键部署、图形化算力分析、异构多核联合调试等功能,解决实际开发过程中最困难的问题。
根据其实际客户开发数据的统计,整个软件框架可为芯片厂商节省60%的AI基础软件开发成本,缩短方案厂商50%的应用开发时间。
3、基础软件:对接丰富资源
软件工具链是基础软件,是芯片推广过程中必不可少的工具,软件工具链的优劣很大程度上决定着芯片被使用的概率。
由于基础软件商业变现难,通常不被产品公司重视。
软件生态是开发者能够获取资源的一个大环境,开发者总是愿意采用生态好、资源丰富的AI芯片产品。
二、视觉平台已落地,玄铁910是主控CPU此次发布的无剑视觉AI平台,主要面向视觉AI场景,会根据客户需求持续升级。
近期发布的RISC-V处理器玄铁910,是无剑视觉AI平台的主控CPU。
玄铁910与芯片设计公司自研的AI加速引擎形成高性能异构计算的完整方案。
这一视觉平台的其他性能有:最大存储带宽400Gbps,单通道PCIE接口带宽16Gbps,可支持16TOPS以下的边缘侧AI计算需求。
据介绍,该平台已应用到多媒体AI芯片、AI视觉芯片、边缘AI服务器芯片等多家IoT厂商的产品中。
无剑平台同时对IP公司开放,吸纳全球最有竞争力的IP产品与无剑平台进行原型流片验证,已经过硅验证,并且已在阿里内部和多家客户的芯片产品中得到应用。
未来,无剑平台还将面向MCU、工业、安全、车载、接入等应用领域开发基础设施及周边技术,持续推出面向领域的SoC平台。
三、无剑如何将设计成本和周期各砍一半?无剑能将设计成本和周期分别降低50%,主要来源于两个方面:
第一,平台化的设计方法让IP能够很快的接入到系统,大幅降低IP支持成本,IP的价格将大幅下降。
第二,通过硬件平台化和软件平台化的思路,研发上面的人力投入大幅降低。综合来讲,设计成本有望降低50%。
平台化的思路,是指减少芯片设计过程中的重复性的投入,50%以上的设计验证工作是可以消除的。
另外,如果平台的各种模拟IP与代工厂工艺已经完成了验证,可以跳过3个月以上的试生产(MPW)的阶段,直接进入量产,通常芯片从设计到量产的时间可以达到9个月以内。
“敏捷设计是下一阶段芯片设计领域发展的重点方向,”清华大学微电子所副所长、清微智能创始人尹首一教授表示,“软硬件深度融合的有行业特点的芯片平台让芯片设计公司省去很多底层的芯片开发工作,更加专注于产品定义与核心技术本身,形成差异化的芯片产品,提升市场竞争力。”
四、端云协同,能天然接入阿里云AIoT在线智能的特点,需要端云协同来实现。
所谓端云协同,是指在下一代芯片开发时,仅要考虑到端上的计算能力,还要考虑云上的能力。
例如,AI芯片的网络模型需与云端频繁互动,需要从芯片底层到操作系统方面的架构支持。
平头哥隶属于阿里云智能,根据阿里云业务场景进行云端一体架构的探索与尝试。
无剑AI芯片平台的端云一体,是平头哥软硬件基础能力的体现,体现在围绕云计算的场景中,端侧设备具有实时与云端应用互动的能力。
基于平头哥芯片平台的产品能天然接入阿里云,与云端应用生态对接后将形成新的产品形态。
五、“平头哥”模式与阿里的芯片定位
平头哥的长远目标,是做AIoT时代芯片基础设施提供者,为了接近这个“小目标”,它提出了芯片设计的“平头哥模式”:
以无剑平台为核心,从芯片到应用全栈开放集成,实现处理器、算法、操作系统等软硬件核心技术的深度融合,打破传统通用芯片时代IP授权商用模式成本高、使用难、周期长的局限,为企业提供从芯片到应用的全栈技术能力。
简而言之,平头哥模式具有三大特点:全栈、开放、被集成。
它的优势很明显:一是IP、系统芯片设计经验丰富,在处理器领域有充足话语权;二是有钱,也愿意长期砸钱、砸人才;三是整合丰富的生态资源,通过构建平台,降低芯片设计门槛。
这与阿里在芯片上的定位一致,即做好芯片行业的基础设施。
处理器是所有高端系统芯片都需要的产品,是最核心的基础设施产品,阿里将投入重金打造好技术,同时构建应用生态。
除了处理器以外,阿里还将继续开发操作系统、软硬件融合的算法、核心的IP等,将这些共性的技术能够做好、做精、做出竞争力。
当然,大目标是要形成生态,然后开放给他们的芯片设计,使之基于高质量的基础设施打造芯片产品,以提升整体的产业竞争力。
六、芯片设计进入3.0时代平头哥半导体研究员孟建熠认为,芯片设计方法正在进入新的3.0时代。
1.0时代从1990至2000年,芯片设计基于ASIC流程进行,每次研发新芯片都需从电路开始重新设计。
2000年后进入2.0时代,基于IP的模块化的设计方法,降低了芯片的开发成本和设计风险。
AIoT市场具有强应有驱动、场景碎片化等特征,随着AIoT应用发展如火如荼,需要更加高效的设计方法。
由此,芯片设计进入3.0时代,在基础框架/模板基础上,定制符合应用需求的芯片产品,以最快速度推向精准市场。
据国际数据公司IDC预测,到2025年,全球联网的IoT设备将达到416亿台,这些端上设备将产生的数据量是79.4ZB,相当于9万亿部时长2小时的高清电影。
Gartner预测,其中80%的IoT设备将由AI加持。
在摩尔定律时代,芯片研发追求通用性,比工艺、比投入。
在后摩尔定律时代,碎片化的AIoT场景对芯片的要求更多在于市场灵敏度,芯片研发比的是需求适配和成本。
传统通用芯片设计方式往往太重,成本投入高、设计周期长,很难适应未来AIoT市场小批量、定制化的需求。
很多SoC设计方法虽然效率较ASIC设计方法有很大提升,但从IP到系统集成验证、再到软件调试过程,依然耗时耗成本。
无剑芯片平台正是针对这一痛点,试图提供全新的、更加高效的设计方法学。
这只是平头哥野心的初步成果,平头哥的雄伟目标,是以生态营造者的角色,引领芯片3.0时代。
结语:AIoT芯片或进入更快落地潮算力是推动AI产业发展的重要动力,而在智能应用不断快速裂变的今时今日,所有芯片都面临着升级。
近年来,传统芯片公司、互联网公司、AI芯片创企和算法公司纷纷投入AI芯片的浪潮之中,开发出满足自身或市场需求的AI芯片。
AI芯片的第一波浪潮已经过去,很多产品正面临着市场严酷的考验,大浪淘沙,缺乏应用场景的AI芯片将被市场淘汰。
而随着像无剑这样的一体式芯片设计平台的普及,很多中小型的设计公司可以根据应用快速定制出芯片产品,形成“快鱼吃慢鱼”的格局。
AIoT产业或许将呈现更欣欣向荣的定制化芯片落地浪潮。
,