ITU于2020年8月正式发布AI芯片基准测试标准:ITU-T F.748.11 “Metrics and evaluation methods for a deep neural network processor benchmark(深度学习处理器基准测试评测指标与方法)。

评测标准是AI芯片产业的基础和标尺

近年来,AI芯片发展呈现出百花齐放的态势,然而在产业成熟度、落地应用等方面仍存在诸多问题。其中,AI芯片的选型就是当前人工智能企业面临的一大难题,建立AI芯片测评标准已成为助力人工智能产业健康发展的一大诉求。基准测试是一种常用的性能指标测试方式,在计算架构演进中扮演着非常重要的角色,清晰的基准测试指标,不仅可以帮助技术供给企业快速进步,还可为需求方的选型提供参考。

目前,AI芯片的评测,国际上主流的有MLPerf,苏黎世理工的AI benchmark,国内有中国人工智能产业发展联盟(以下简称“AIIA”或“联盟”)的 AIIA DNN benchmark,小米的Mobile AI bench, 中科院计算所智能计算机研究中心的NPUBench等。这些评测多数属于基准测试的范畴,由于这些基准测试的出发点不同,设计的思路,基准测试的内容和评估指标也都不尽相同,业界尚未有公认的基准测试标准。权威基准测试标准的缺失,一定程度上导致了人工智能应用企业、集成商、开发者无法准确评价芯片在同行业的技术水平,也无法体现国际市场中的地位。

首个AI芯片基准测试国际标准

ITU发布的首个AI基准测试评测标准,ITU-T F.748.11 “Metrics and evaluation methods for a deep neural network processor benchmark(深度学习处理器基准测试评测指标与方法),提出了AI处理器/加速器在完成以深度学习为代表的人工智能任务时的基准测试框架,涵盖训练任务、推理任务的基准测试评估指标(Metrics),具体的评测方法和推荐评测场景下的工作负载(Workload)。基准测试指标包括时间、吞吐、能效比和准确率等,评测场景以视觉、语音、推荐三大类场景为主,具体包括图像分类、目标检测、语音识别、机器翻译等8大类AI应用。

该项国际标准由中国信息通信研究院牵头,于2019年7月在国际电信联盟第十六研究组(简称ITU-T SG16)Q5 报告人会议上提出立项,并担任编辑人(Editor),历时近1年,经过多轮讨论修订,于2020年6月22日-7月3日,举行的ITU-T SG16全体会议提交报批并通过全会审议进入公示阶段,于2020年8月正式发布。

其评测方法、评测指标及场景参考并采纳了联盟评估规范、AIIA DNN benchmark项目相关研究和中国通信化标准协会行业标准的相关内容,参与单位包括华为、腾讯、Arm中国、寒武纪、阿里巴巴、百度、Intel、赛灵思、Imagination、紫光展锐、鲲云科技、地平线、南京新一代、燧原科技、西安交通大学、清华大学等20余家企业、高校及科研机构。

AI 芯片基准测试国际标准的正式发布,标志着我国在AI芯片领域评测能力得到了国际认可,也是我国AI芯片科研人员对国际标准化研究的重要贡献,将为我国AI芯片技术、产品和评测走出国门开辟了道路。

免责声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们处理。

相关推荐