中国信息通信研究院云大所人工智能部主任工信部人工智能技术和应用评测实验室常务副主任 孙明俊

编者按

随着人工智能技术广泛应用于日常生活的方方面面,以深度学习为代表的人工智能技术在感知层面突破后开始演进。基于深度学习的视觉、语音、自然语言处理等研究占据主流,并开始聚焦技术的“理解”能力。

伴随智能家居产业进入AIoT时代,语音识别与机器视觉技术应用不断深化,不断推进着由感知智能向认知智能的升级。与此同时,AI技术也在赋能于更多细分领域,催生出更多的创新价值。

孙明俊老师长期从事人工智能,云计算,多媒体系统研究工作,牵头负责多项人工智能、云计算和视频通信标准,主持多项省部级课题,获得多项国家、省部级奖项,主编《人工智能浪潮》系列丛书。本次分享主要围绕人工智能如何提升看、听、说能力?人工智能技术如何解决产业共性问题?AI在抗击疫情中的创新技术应用。

人工智能技术及其发展趋势

众所周知,AI已经广泛应用到人们生活中。但是从整个人工智能产业发展来看,目前我国还是处于弱人工智能阶段,强人工智能道路艰且长。2015年开始,以深度学习代表的人工智能在感知层面突破后开始演进,深度学习作为一个分类器,能够达到90%识别率。尤其是深度学习体系红利的释放,如美颜等不需要资质审批的低门槛应用已经非常广泛。2019-2020年,大环境导致投资规模降低,商业模式转变,使得人工智能的道路更加艰难。

人工智能发展分为几个阶段。人工智能1.0阶段,仅仅是概念的提出,并没有真正进入。2.0阶段,典型特点是以深度学习代表的连接主义占据了主导的地位,感知AI获得了突破。2020年,机器学习重新回到舞台,开始解决深度学习所面临的问题。在2018年末,很多行业大咖表示深度学习已死,其实不是深度学习已死,是深度学习在很多领域无能为力,但是我们对它寄托了很多期待。3.0阶段,人工智能是无意识的。我们期待,人工智能真正可以进入多学科,如科技,哲学,人文,历史等等,使得AI从感知阶段走向认知阶段。2019年,深度学习开始吸收其他机器学习的思想,用联邦学习,迁移学习、多任务学习、多模态学习、强化学习等方法,尝试解决数据和场景层面的问题。

在认知领域,多种流派开始活跃。2019年,贝叶斯派与深度学习相结合,演变为图神经网络,故当时图神经网络数据库受到热捧。注意力模型逐渐建起机器意识。基于数据驱动和基于知识驱动的理论体系进入协同融合阶段。科学家们纷纷聚焦在技术的理解能力上。

2019年,人脸识别技术慢慢成熟,广泛应用金融、医疗、安防等领域。许多国家出台人脸识别管理政策。在2020年初,新型肺炎爆发,口罩是人们出门必需品,人脸识别变为困难,物体遮挡成为技术发展的热点。

人与智能设备的交互在近几年来非常火热。互联网大企业、科技企业纷纷推出智能音箱,车载语音,用占领入口的方式去占领行业的生态。实际上,带有语音情感,逻辑分析的交互确实比简单人机交互更加受欢迎。

从场景方面看,人工智能在车载、家居和教育上面的应用都非常出色。而医疗的应用因为此次疫情,人与人需要隔离,语音导诊机器人重新获得春天。LPG技术进步明显,表现为模型更为复杂,算力消耗更巨大,效果更优越,迁移更灵活。

知识工程被认为是认知智能的突破口,以知识图谱为代表,在上游大数据和AI上已形成有效连接。在搜索、问答、推荐方面,越来越凸显出重要价值。整个知识图谱往特色、开放、智能方向逐渐演进。知识图谱在行业有非常大的潜力,通过知识图谱,最终可实现认知智能,推动可信任AI。广泛应用到智能决策、情报分析、商业智能领域。

我们观察到,技术和底层有关系的特点是软件训练框架的收敛,用于推断的专业芯片日益增多。往前回溯,手机刚出现时候,出现了很多开源的操作系统,试图占据生态。后来训练框架开始收敛,很多模型的迁移能够互通、合并。

总体来看,技术呈现不断发展的阶段,应用领域也在不断扩大。尽管如此,强AI还需要时间。

我国人工智能主要应用领域

目前人工智能还是一个初步形成的产业,产业链的打造速度相比其他行业要慢的多。但是,产业链已经形成非常好的态势,初创企业依然在不断爆发中。人工智能在网络、云计算、大数据之上,成为新基建的一部分后,需要强化自身能力,包含专用与通用芯片,开源生态,计算框架和应用技术。另一方面,如果人工智能成为了基础设施的一部分,需要为各行各业赋能,输出更专业的系统解决方案。

我国的人工智能体量一直在全球保持在第一梯队,仅次于美国。AI专利一直处于稳定增长态势,但人才不足。AI+车联网应用非常广泛,通过知识图谱、智能决策实现感知上的决策,通过自然语言实现交互与控制。很多自动驾驶企业最近遭遇了前所未有的寒冬,当然本身汽车行业淡季是一方面原因,另一方面是AI+车联网迟迟不能产业化,是个非常大的隐忧。AI、车联网和自动驾驶处于不同流派,设计不同监管机构,导致这个领域目前处于发展初期。

人工智能抗击疫情产业链

人工智能在疫情排查,诊疗用药,后勤保障方面都有很多产品。疫情排查有语音外呼机器人,体温检测,大数据疫情跟踪。诊疗用药包含基因组分析,肺部影像、在线问诊。后勤保障有远程办公。

同期来看,AI测温和大数据分析在抗击疫情中使用最热。AI体温检测系统如今产能严重不足,上游原材料周期长,并且高精度黑体等材料需要进口,导致技术短缺。AI+医疗影像在疫情中是刚需,整个性能也在进一步提升。智能外呼机器人,目前还存在一定瓶颈。如不能理解超出预定的话术、有效处理方言、灵活处理应用知识等。AI+ARP,主要聚焦为攻破方言。智能客服上下游开始百花齐放。AI防控机器人,对人机交互的要求格外高,在防疫场景下,对话、跟随、引导、咨询问诊、定点配送等成为常用需求。AI赋能视频会议系统美颜等功能,解决了疫情期间大家远程办公的问题。

人工智能产品评测分析

人工智能产品目前面对很多困难,如缺乏规范的标准,技术单场景,无法快速迁移等。目前人们需求点是效率高,质量达标,安全性强。故标准评价非常必要,我们针对目前行业产业链,拟出一套人工智能标准和评估规范全栈体系,覆盖基础支撑、平台、产品应用等全方面。建立了人工智能评测平台,实现一站式人工智能产品评测选购、交流、对比。

计算机技术产品标准和评测,主要聚焦在家用摄像机和工业摄像机上。家用摄像机强调的是人形检测能力,技术和产品已经逐渐成熟。除此之外,计算机视觉,机器翻译,智能客服,智能音箱等领域的很多优秀厂家产品,都已经通过我们的评价系统和标准。在抗疫过程中,我们建设了疫情防控信息平台,通过平台,收集到500多家抗击疫情产品。平台不仅是给国内人们提供产品,同时也面向疫情严重的海外国家。

问题一:智能音箱的评测评级的
指标是什么?

智能音箱的测评根据功能和性能,包含交互能力、识别准确率等。隐私性是智能音箱普遍存在的问题,不管是语音还是计算机识别,识别的不是声音和图像本身,而是所呈现出的特征。端侧,可以处理成只上传特征,不能还原成声音和图像。但是,这对端侧的处理能力带来成本的巨大困难和挑战。随着人工智能产业的技术成熟,我相信将慢慢解决所有人工智能产品引起的隐私性问题。

问题二:生活类90%以上是伪智能,
生活类人工智能未来的发展方向?

以机器学习角度看,智能一旦成熟,就不再认为是智能了。看、听、说、写、知识图谱将融合到生活中去。看上去简单的产品,实际上需要系统性能力去支撑。

本文整理自CSHIA智能家居微课堂
《人工智能发展趋势及在疫情中的应用》课程
扫码观看视频内容

免责声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们处理。

相关推荐