寒武纪思元370通过芯粒技术适配多样场景需求

思元 370 是寒武纪首款采用 chiplet(芯粒)技术的 AI 芯片,应该也是国内首颗 chiplet AI 芯片。基于台积电 7nm 制程工艺,整体集成了 390 亿个晶体管,最大算力达到 256TOPS(INT8),这一数据是

思元 370 是寒武纪首款采用 chiplet(芯粒)技术的 AI 芯片,应该也是国内首颗 chiplet AI 芯片。基于台积电 7nm 制程工艺,整体集成了 390 亿个晶体管,最大算力达到 256TOPS(INT8),这一数据是寒武纪第二代产品思元 270 算力的 2 倍。

凭借寒武纪最新智能芯片架构 MLUarch03,相较于峰值算力的提升,思元 370 实测性能表现非常亮眼:同功率性能超过 T4 两倍还多,完成同样的任务,功耗可以是 A10 的一半。

此外,寒武纪还基于思元370智能芯片的技术,通过Chiplet(芯粒)技术,灵活组合产品的特性,适配出符合不同场景需求的三款加速卡,包括:MLU370-S4、MLU370-X4和MLU370-X8。

具体来说,MLU370-S4为半高半长单槽位加速卡,板卡功耗为75W,可面向机器视觉/推理任务,适合于对计算密度要求较高的数据中心场景。

而MLU370-X4为单槽位150W全尺寸加速卡,可提供256TOPS(INT8)推理算力和24TFLOPS(FP32)训练算力,同时提供FP16、BF16等多种训练精度,主要面向互联网行业等推理任务或训推一体场景,适合于对单卡算力需求较高的应用场景。

MLU370-X8则采用双芯思元370配置,为双槽位250W全尺寸加速卡,可提供24TFLOPS(FP32)训练算力和256TOPS(INT8)推理算力,同时提供丰富的FP16、BF16等多种训练精度,主要面向对算力和带宽要求较高的训练任务。在业界应用广泛的YOLOv3、Transformer等训练任务中,8卡计算系统的并行性能平均达到350W RTX GPU的155%。

寒武纪思元370通过芯粒技术适配多样场景需求

总而言之,寒武纪在同样的研发费用之下,满足了更多元的市场需求。

据了解,寒武纪是智能芯片领域全球知名的新兴公司,主营业务是各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发、设计和销售,通过向客户提供芯片及加速卡产品、训练整机、智能计算集群系统、IP授权及软件获取业务收入。

成立以来,寒武纪一直根据市场和客户的需求,加强研发创新投入力度,持续升级迭代云边端系列化产品及基础系统软件平台,丰富公司的产品矩阵,以适应不同的人工智能应用场景。

(本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除。市场有风险,选择需谨慎!此文仅供参考,不作买卖及投资依据。)

原创文章,作者:陈晨,如若转载,请注明出处:https://www.kejixun.co/article/563565.html

陈晨陈晨管理团队

相关推荐