浅谈ai芯片的市场应用（AI芯片算力爆发）

记者 | 彭新编辑 | ，下面我们就来说一说关于浅谈ai芯片的市场应用?我们一起去了解并探讨一下这个问题吧!

浅谈ai芯片的市场应用

记者 | 彭新

编辑 |

AI产业火爆，AI芯片更是绝对的明星。

“芯片论坛异常火爆，已经有一千多人预约，但现场位置只有200个，主办方建议我们早点到现场。”在世界人工智能大会“AI智能芯片定义产业未来论坛”举办前，有厂商向界面新闻记者反馈。

作为AI产业的底层算力支撑，AI芯片成为绝对焦点。总体来看，以芯片驱动的人工智能和自动驾驶是展会重点，无论是大会展区还是产业论坛，都是参观者不时驻足观看、热切讨论的话题。

国产AI芯片加速追赶

在WAIC会场内外，AI芯片企业的存在感都颇为强烈，数家芯片公司在会展期间发布了AI芯片产品，登上世界舞台。

AI计算大致分为两个层面，首先是对模型进行训练（training），整个过程可能耗时数天；之后是训练出的模型响应实际请求，做出推理（inference）。目前，英伟达旗下的GPU（图形处理器）占据训练市场，多数推理任务则仍由传统的英特尔CPU承担。面向训练和推理场景，国产AI芯片厂商均推出了相关产品。

国内AI芯片初创企业燧原科技发布第二代人工智能训练产品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组，全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群”，在WAIC展会会场，燧原科技展台颇受观众关注。

燧原科技的创始团队来自英伟达长期竞争对手AMD。公司创始人兼CEO赵立东曾担任紫光集团副总裁，更早前在AMD工作了7年时间，任计算事业部高级总监等，90年代在老牌显示芯片公司S3 Graphics任职。

“英特尔的芯片技术发展战略是Tick–Tock模式，Tick阶段升级工艺，Tock阶段升级处理器架构。对我们来说，我们第一代芯片是一个全新的架构，第二代我们有一个选项，架构保持大致不变，工艺向前演进，然后再架构再工艺，这就是沿着传统的Tick–tock这条路走。第一代芯片在落地过程和客户磨合过程当中，我们觉得架构的演进比工艺演进更重要。”赵立东称。

燧原科技外，天数智芯展示了国内第一款全自研、GPU架构下的7纳米制程云端训练芯片B1及GPGPU（通用计算GPU）产品卡。这颗芯片可容纳240亿晶体管及采用2.5D CoWos晶圆封装技术，支持FP32,FP16,BF16,INT8等多精度数据混合训练，支持片间互联，单芯片算力每秒147T@FP16。选择新款7纳米制程的原因在于，AI芯片对于制程要求较高，追求更先进芯片制造工艺也成为AI芯片厂商的重点。

推理芯片方面，登临科技展示了自主创新的GPGPU芯片，致力于解决通用性和高效率难题，在完整提供CUDA/OpenCL硬件加速能力的基础上，全面支持各类流行的人工智能网络框架和底层算子。

壁仞科技联合创始人张凌岚对近日对外界称，算力芯片是人工智能时代的发动机，相比西方几十年的积累，我国芯片制造行业仍处于起步阶段，据透露，壁仞科技明年将发布首款通用智能计算芯片产品。

不出意外，凭借在人工智能存在巨大优势的英伟达成为各厂商争先比较的对象。目前来看，AI芯片领域竞争激烈。目前GPU（图形处理器）厂商英伟达是市场上图形计算和AI计算上的领先者。

AI芯片新架构、产品层出不穷。服务器、云计算厂商对新型芯片选择持开放态度，浪潮AI&HPC总经理刘军曾告诉界面新闻称，AI芯片领域竞争非常激烈，公司数量非常多，包括在中国、美国、英国等，有一定的同质化。

芯片巨头发力AI各有“绝活”

主要芯片巨头，在会场上也公布了自己的AI应用方案。

苹果副总裁、大中华区董事总经理葛越在2021世界人工智能大会发言中，详细介绍了苹果芯片中的AI应用、架构和模式。

“苹果设计的芯片不是用来出售给其他公司，而是专门为苹果特定的产品，甚至是为了特定功能而专门设计的。这种优化贯穿于CPU、GPU、图像信号处理器及更多组件。”葛越称。

对于自研的坚持还体现在机器学习上，苹果的芯片中搭载了“神经网络引擎”。所谓“神经网络引擎（neural engine）”，是苹果在芯片中专门用于机器学习的硬件，可用于图像处理、人脸识别等。目前，iPhone12搭载的A14仿生芯片中的神经网络引擎能够完成每秒11万亿次的运算，是目前最强大的移动AI芯片之一。

葛越进一步介绍，M1芯片采用Arm架构设计，为5纳米制程，是当前电脑产品中制程最先进的芯片。该款芯片上共有160亿个晶体管，将中央处理器、图形处理器、神经网络引擎、各种连接功能以及其他众多组件集成在芯片上。

得益于此，M1芯片完成了看似不可能完成的任务：性能显著提升，包括将机器学习速度提升最高15倍，电池续航时间最高提升2倍。“苹果的芯片专为自家产品量身定制，并为机器学习进行了专门的优化。由于机器学习能够为用户提供更为独特的体验，因此，苹果早就开始研发能在设备端有效运行复杂机器学习算法的芯片。”

老牌芯片巨头英特尔，对人工智能也有自己的理解。“过去两年，我们发现有非常多的自主设备，非常多的数字化系统，需要用人工智能来处理。人工智能成为推动数字化转型的一大超级力量。” 英特尔研究院副总裁、英特尔中国研究院院长宋继强在WAIC会场上表示，他指出，从数据变化而言，处理海量数据只能依靠人工智能，而多元化数据形态也需要很多新的算法去梳理。

对此，英特尔认为，进入到新的时代，需要掌握更多不同的架构组合，以此满足专属特定领域的需求，因此架构创新是关键驱动力。"CPU适宜处理标量架构的，一个一个算，比如说控制流，非常容易去处理，可以去并发；GPU则适宜处理矢量运算，很多数据一起算；AI则更多是块状运算，需要专门做矩阵加速，数据的存取也需要优化；FPGA特别适合做一些稀疏的运算，可以大幅度降低I/O以及计算的消耗。这些把它整合起来就能各取所需，我们说常打组合拳会好过只用一种武器去解决所有问题。”宋继强向界面新闻记者解释。

高通在其移动芯片上集成AI功能有一定研究，高通中国区董事长孟樸介绍，在包括极速5G连接、高性能低功耗计算以及终端侧应用中，AI技术正在驱动新一代智能边缘终端和云计算的发展，万物能够实时连接至云端，让终端、体验和数据受益于不断增加的内容、处理能力和云端存储空间。

孟樸解释，为了实现AI的规模化，首先需要确保智能广泛分布于整个网络。业界预测，2020年至2026年，月度移动数据流量将增长500%以上，数十亿全新联网终端和事物将分布于边缘侧。有效应对数据的快速增长，需要的不仅仅是将数据传输至云端，还需要在终端侧集成AI能力，直接运行算法，为云端智能提供有力补充。

而终端侧AI具备多项关键优势，包括更高的即时性、可靠性和安全性。这些优势对于时延敏感和关键业务型应用至关重要，如自动驾驶汽车、智能电网和联网基础设施等。

“智能边缘终端产生的内容丰富的数据能够实时共享至云端，使AI得以充分发挥作用，并实现从云端到边缘侧的AI规模化应用。如今，AI几乎融入智能手机体验的方方面面，从影像到语音识别和安全，很快AI还将带来包括高度个性化、互动性和情境相关性的体验。”孟樸称。

场景成为AI芯片发力点

若AI芯片没有落地场景，就可能是空谈，面向场景和实际需求成为许多AI芯片厂商的宣传重点。

例如，寒武纪创始人兼CEO陈天石就在WAIC上预告了寒武纪正在设计中的车载智能芯片，称“拥有超过200TOPS的算力，采用7nm制程，具备车规级标准和独立安全岛，并将继承寒武纪云边端一体化的统一软件工具链。”

寒武纪是中国第一个推出云端智能芯片的创业公司，有云端训练芯片思元290和推理芯片思元270，以及用于边缘计算的思元220芯片的完整产品线。“到今天寒武纪已经形成覆盖了云、边、端三个领域，包括训练、推理等相对全面的不同品类的AI芯片，目前寒武纪产品线的特点就是‘云边端一体’，”陈天石表示。

目前，地平线车规级芯片征程3目前销售超过4.5万片，预计全年销售超过20万片，主要用于理想One等车型。而作为征程3的升级版地平线征程5芯片于今年5月点亮，面向L4高等级自动驾驶。

自动驾驶以外，面向智能安防、工业视觉、车载视觉场景的AI芯片成为热门。在WAIC期间，酷芯微电子发布新款高清AI相机芯片AR9341，酷芯微电子创始人沈泊在发布会称，该芯片集成了酷芯自研的深度学习处理器（NPU），具有4TOPS（相当于每秒进行4万亿次）峰值算力，架构优化后实际算力可等效于竞品的8-10TOPS。

作为中高端相机芯片产品，AR9341芯片目标应用领域包括高端智能IPC、车载辅助驾驶、边缘计算盒子以及智能机器人等，其工程样片预计将在今年9月份提供，量产时间为今年12月。

但并非所有人对此类芯片保持乐观态度，尤其是面向特定细分场景的AI芯片。此类实际上是牺牲通用性来换取AI等特定任务上更高的效率。有行业人士认为，市场上的AI芯片非常突出的一个问题，就是产品的通用性不足，目前唯一真正通用的还是GPU。他相信AI芯片会是百花齐放的局面，在不同领域会有新产品出现。

对此，中国电子技术标准化研究院集成电路测评中心主任任翔提醒，在AI芯片产业向上发展的同时也面临诸多挑战：首先，AI芯片面临更加广泛以及多样化的需求，AI芯片产业生态化需求日趋明显；同时，面向不同场景时，AI芯片的利用率、兼容性等有待提高，各类基于不同AI芯片的异构设备协同困难。
,

浅谈ai芯片的市场应用（AI芯片算力爆发）

国产AI芯片加速追赶

芯片巨头发力AI各有“绝活”

场景成为AI芯片发力点

最新推荐

热门推荐