11月18日,全球开发者迎来盛宴,第五届世界声博会暨2022科大讯飞全球1024开发者节线下正式启幕。
科博展之中,AI赋能下的科技、创客、生态、生活等触手可及,人工智能正深刻改变人类生产生活方式。
平台之上,370万开发者、超500万生态合作伙伴的坚守,让人工智能产业“聚沙成塔”,一个渐趋完善的AI生态欣欣向荣。
“与广大开发者携手,投身于人工智能发展大潮,通过源头技术创新、通过系统性创新、通过生态,定义未来。”
大会现场,科大讯飞董事长刘庆峰发表《因为看见,所以坚信》主题演讲,坚定回归价值创造的根本,与广大开发者、合作伙伴共赴山海,看春暖花开。
从核心技术到应用场景,从家庭生活到工作生产,从现实世界到虚拟世界,科大讯飞携手百万开发者伙伴,共绘人工智能全新生态版图,共筑数字世界新未来。
以下为演讲实录:
各位线上线下的朋友们,大家好,很高兴与大家共同探讨人工智能技术的最新进展和广阔的应用前景。
今天,我们看到了人工智能激动人心的核心技术进展与应用情况,不仅在民生事业通过教育、医疗、养老来帮助和温暖每一个家庭,也将通过工业互联网、虚拟经济、元宇宙深度赋能我国工业发展,在现在、未来深刻地改变世界的生产和生活方式。
当前全球面临着军事、政治、经济的高度不确定性,在探讨这些宏大命题的同时,我们与所有的合作伙伴和开发者们,也在思考我们当下生存和发展的舞台——未来经济发展,最核心的动力来源在哪?
如果你来到我们这一次全球开发者节科博展现场,当看到了创新馆、工业馆、企业馆、生态馆等,看到我们在教育、医疗、智慧城市等领域的各种成果,就会明白,我们对于未来不仅仅是带着理想的相信,而是因为看见(人工智能的价值与成果),所以坚信人工智能和中国科技广阔的未来。由此,今天我的年度演讲的主题是——因为看见,所以坚信。
人工智能是数字经济发展的核心引擎
首先我们来通过一组数据,看看中国乃至全球经济下一步发展的主要动力来源。
刚刚召开的乌镇全球互联网大会上发布的蓝皮书指出,去年一年,全球47个国家的数字经济增长增加值规模达到38.1万亿美元,同比名义增长15.6%,占GDP的比重达到45.0%。
而科大讯飞的人工智能开放平台,在去年开发者团队数量一年内增长32%。与此同时,不仅是开发者团队数量的增加,实实在在的应用AI调用增速达到36%。
再来看具体的几组应用数据。讯飞输入法去年一年调用增加了45%,而科大讯飞AI学习机,在我们希望让孩子以更少的时间来使用、获得更高的学习效率的前提下,AI调用增速106%。能够用于赋能提升工作效率的讯飞智能办公本,调用增长了126%。
从这些数据我们可以看到,数字经济是全球经济复苏最关键的动力来源,而人工智能就是数字经济发展最核心的引擎。
人工智能不仅将深刻地改变世界的生产和生活方式,还将像习近平总书记说的那样,是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的“头雁”效应。
因为疫情,今年的大会我们没能在10月24日举行,但很有意思的是,我们从昨天开始举办开发者大赛决赛和分论坛、今天主论坛,而这恰恰是中国农历1024,择日不如撞日。
参加本次开发者大赛的团队数,从去年的22472支增长到了32333支,增长了44%,可见在人工智能领域大家的渴望和热切参与的程度。增长最快的是工业互联网团队,达到了10605个,而虚拟现实、元宇宙方向达到了1268个,增长了好几倍。
其中还有一个特别有价值的数据,今年我们108个赛道,其中有72个算法赛、36个应用赛。算法赛前三名的平均年龄26.5岁,而应用赛(因为应用赛是以公司、项目组为单位就没统计年龄)中有上市公司、独角兽、潜在独角兽,但有72%获得前三甲的队伍是从未融资过的企业。
今天的开发者大赛是年轻人的舞台,新的创业者共同在全新的舞台上绽放精彩。所以,今天的Z时代、95后的年轻人在关注什么,就代表了未来是什么。工业互联网、虚拟现实、元宇宙大潮兴起,而在此之中,95后的Z时代正成为我们AI开发者的主角。
关注此次大会的还有很多的投资机构、金融领域的合作伙伴,而这“72%”,就是大家要培育的下一个“科大讯飞”、乃至下一个中国经济的未来。
人工智能关键技术进展
面对未来,我们究竟做了哪些准备?
今年年初,科大讯飞发布了“讯飞超脑2030计划”。面对未来社会事业、工业发展和人类发展的刚性需求,拥抱未来需要提前做好技术准备。
“懂知识、善学习、能进化”的机器人要能够进入每一个家庭、企业,这其中既有虚拟人,也有实体机器人(从机器狗到仿人形机器人等)。我们设定了数字虚拟人和软硬一体机器人的发展进程与成果规划。
从去年的1024开发者节到现在,我们在人工智能关键技术的进展,核心是在解决多模感知、深度理解、多维表达、运动智能这四大问题(每一项进展都可以在今年的1024科博展中感受到,欢迎体验)。
多模感知。以前最大的困难是复杂公式识别,因为人工智能缺乏充分的复杂公式学习数据。在去年取得突破的基础上,今年进一步做到了业界领先,数学公式、化学公式、包括有机化学等复杂公式都能够识别。我们的图文识别技术在全球性的比赛中连续三年拿到第一名,并已被用在考试中。
手势识别。不光是简单的动作,还能够进行凌空手写识别,单摄像头实现业界一流效果。这意味着,在虚拟世界,你只需要写写画画,所写东西都会出来。大家都可以去展馆体验,还有可以实现眼神打字的眼神识别。技术不仅能够用在未来虚拟世界,在现实世界中对人类的帮助也是显而易见的。
语音识别。在国际上有每两年一次的高噪音复杂场景的比赛(这也是今天语音识别要面对的主要挑战),科大讯飞都是全球第一。两年前我们虽然是全球第一,但只有70%左右的准确率,而现在我们已经做到了通过语音识别和嘴型识别的多种模式识别,在很多领域高噪音环境下做到实用。
我们要通过语音、图文、视频、环境感知能力实现系统性创新,真正解决复杂的虚拟和现实场景的应用问题。
用人工智能解决重大社会命题,需要从“0”到“1”的核心技术突破和系统性创新能力相结合。
深度理解技术进展如何?去年曾跟大家分享,在深度理解领域中,我们在全球首次让机器的阅读理解超过了人类平均水平。在斯坦福大学牵头的SQuAD的比赛上,机器回答问题已经超过人类的平均水平,我们的机器在医疗领域、教育阅卷领域取得了令人欣喜的成果。
今年,我们又进一步把阅读理解的深度理解能力提升到了知识推理所能达到的新高度。
知识推理最权威的比赛是艾伦研究院组织的OpenBook QA的知识推理,其中就有类似于“地球自转会引起什么?”“土豆、牛奶、番茄、火鸡哪个来源于植物?”,机器要跟人类去PK回答这样的开放问题。今年7月份,我们在单模型上已首次超过人类水平,标志着我们认知智能的重大突破。
今年,依托科大讯飞建设的认知智能国家重点实验室,成功获得科技部重组批复,成为科技部遴选的首批建设的20家重点实验室之一。
我们更深入地触及教育的本质
这些的技术进步,让人工智能在民生事业的赋能上有了不同的高度——深度理解的进步能够更深入地触及教育的本质。
当年,在安徒生诞辰100周年之际,大家纪念他对人类的贡献是什么?是童年。他说,“童年不是为了成年做准备,它是独立的阶段。”爱因斯坦说:“教育的本质不是灌输知识,而是让你独立思考。”
教育的本质是什么?当把课本上的所有知识都忘记之后,剩下的东西才是教育的本质。
用AI帮助人类回归教育的本质,我们认为可以通过四大台阶。
第一,知识学习。这是我们已经在践行、并且在海量的教学中产生了重大作用的知识学习,让学生减负增效、强化自信心,从而腾出时间去五育并举。
第二,理解学科的核心素养,能够解决实际问题。这也是发达国家很多成功的经验,中国也在这方面探索。第三,综合素养,包括注意力、观察力、思维力等。第四,心理健康。
我们不仅要为孩子们未来的人生梦想成真做准备,还要让他们拥有幸福的当下和童年。
人工智能核心技术领域的进步如何赋能每一个家庭和孩子?首先对于知识学习,我们可以通过知识图谱精准分析孩子知识的掌握程度,按图索骥,根据人工智能的分析进行个性化分层作业。
现在全国范围已经有5万所学校1.3亿师生在使用。统计数据表明,单点知识的学习训练量下降了58%,关键的是学习兴趣提升的29%,焦虑情绪下降20%。
下一个台阶是学科综合素养,我们构建新一代学习系统。比如一道去年的高考模拟题,不仅要考察数学成绩,还要在空间几何体结构中考察直观想象、逻辑推理和数字抽象的核心素养,需要通过我们的知识点图谱和核心素养图谱进行共同构建来学习。
我们已经在很多地方产生了初步成效,源头技术就在于深度理解能力。
进一步拓展到人的综合素养。科大讯飞有幸与北师大一起承担了中国脑计划的重要环节——儿童脑计划,促进亿万青少年的综合成长。
我们已经在业界推出了首个全国样本代表性的儿童脑智发育的检测平台,全国已有25万孩子参与,样本的普遍性促进平台的有效性。我们推出的飞飞博士系列专注力训练营,已在安徽、湖北、四川、浙江上万学生中使用,同时在讯飞学习机中持续更新。
注意力是所有其他认知能力的基础,从而促进孩子综合素养的提升,我们已经在注意力上取得了能用统计数据证明的成效——孩子们前后测表明,注意力水平提升了37%。
心理健康问题非常重要。我们和北京安定医院、全国抑郁症组委王刚院长一起构建了抑郁症筛查平台。
原先全球公开出来的最优秀的技术成果只能做到78%,而安定医院的实测数据说明我们对抑郁症筛查的准确率已经达到91.2%。
抑郁症筛查不仅要求能够判断是否患有抑郁症,还要求能够对患者情况进行分类从而关注或引导。我们的智能抑郁定量准确率达到80.7%,而根据《柳叶刀》统计基层全科医生只有47.3%。
有了数据的支撑,平台已在安定医院常态化使用,明年将正式面向全国推广。我们已经开始从合肥起步,很多的城市也正在试点。
孩子们一旦有自闭或抑郁的情绪,他不愿跟家长或老师对话,更不愿和外界沟通,医生如果不花费长时间很难让孩子打开心扉。我们的智慧心育解决方案来到学校后,80%以上的孩子认可了平台的心理评估结果。
在全国130所试点学校,原先对学校孩子的个性化心理辅导因为精力、能力等原因覆盖率只有10%,现在提高到52%,合肥四中的覆盖率接近80%。孩子考试焦虑水平从34%下降到17%,普遍焦虑从80%下降到了60%左右。
我们正在用人工智能,让每个孩子的未来和当下更加幸福。
用AI更好守护每个人的健康
技术的进步也让AI可以持续、深入地守护每个人的健康。
智医助理——全球到目前为止唯一通过国家执业医师资格考试笔试的机器人,累计已在全国完成辅助诊疗5.1亿人次。过去一年,它辅助修正诊断数超过60万次,光在安徽就修正了17万人次。
还有一个更大的数据,对于基层开出来的用药处方,我们提示了超过3800万人次。这其中有52%是无适应症用药。比如头疼开了治脚的药,对病没有帮助、带来损伤,还花了医保费。
不合理处方中有30%是老年人,8%儿童,1%的孕妇(这1%实际是30万)。不合理用药的重点药品中,抗生素占了22%。处方不合理中,有配伍禁忌、年龄禁忌、人群禁忌等多种类型,其中很多可能引发重大反应。
合肥现在正继续加大力度,让我们用人工智能做前置性提醒(医生如果开药出现异常系统会自动提醒,如果处方正常系统就自然进入下一个流程)防止错误用药。
用人工智能,我们守护每一个家庭的健康和幸福。通过去年一年的努力,我们把辅助诊断准确率从95%提升到97%,辅助诊断推荐合理率Top1。基层医生的首次合理诊断度,以安徽为例,从70分增长到80分以上。
同时,我们也让机器覆盖的疾病从1000种提升到1400种,覆盖各种流行病和传染病,不断提升AI用药审核能力和药品覆盖数量。
我们用人工智能持续打造每一个医生的诊疗助理、给每个人提供健康助手的梦想,正照进现实,规模化服务于健康中国、幸福中国的未来。
AI赋能元宇宙交互
多维表达不仅是教育、医疗领域,其实在司法、智慧城市很多领域都有类似的维度,在我们现场展馆有多维度更直观的成果展示。我们可以基于一个图片、文字的理解,生成多维表达。
通过认知能力、表达对话能力,可以赋能我们元宇宙里面的虚拟人,这也给机器狗、机器人进入每一个家庭提供基本支撑。通过这样的交互技术,在元宇宙里面可以进行自然便捷有趣的沉浸式体验。在讯飞人工智能展馆中,结合语音、眼神、手势识别,每一个人都能够来体验元宇宙交互,还有虚拟人的引导服务。
在虚拟世界中,我们已经打造了一整个虚拟人家族,也就是讯飞超脑2030的第一步目标——虚拟数字人。
在我们的虚拟人家族中,有一个形象叫Luya,是一位偶像歌手,她的单曲《铠甲》发布后短时间内浏览量突破了300多万人次。
虚拟人家族可以在虚拟世界中对人类产生实实在在的帮助,赋能我们在实体世界中拥有更清晰、更友好的感觉,使之照进现实。
在今年的1024开发者节期间,我们还专门组织了全国虚拟人形象设计大赛,让生态伙伴一起来创造新的、有趣的虚拟世界形象。有468支队伍参加,其中有44个优秀团队获得了奖项。在未来,我们会让大家在更沉浸式的展馆中体验虚拟形象,而不是通过现在这样的屏幕。
正式发布机器人超脑平台
除了元宇宙的赋能,机器人也需要更多人工智能、运动智能的帮助。虚拟跟现实结合,需要运动的加持。在运动智能的加持下,未来机器人进入每个家庭变得更加可能。
讯飞的机器狗搭载了全新的算法,运动更加平稳,因为导入了预训练模型,它可以自如克服各种复杂的场景。我们用3D打印出来的轮式机器人,因为搭载了讯飞运动智能,哪怕在上面放很重的小球,都可以非常平稳。正是因为运动智能的加持,未来人工智能将能够更好地赋能实体经济,赋能每个家庭。
今天我们将发布讯飞机器人超脑平台,融合多模交互、运动控制、硬件模组,未来人机协同的模式将在服务、工业等更多的领域诞生,从而推动人机协同进入新时代。
汽车领域,智能多模交互技术将带来汽车人机自然对话的全新升级。
过去很难解决驾驶场景中的高噪音问题,现在通过多模态语音增强技术,可以实现座舱不同位置声音互不干扰。凭借全场景交互体验设计和多模感知能力,我们可以在讲话过程中自由切换、不做任何唤醒、直接开口说话,机器就能识别指令,还能通过识别嘴型、面部表情,监测疲劳状况、心理指数等形成联动,把汽车人机自然交互带上新的高度。
AI赋能工业互联网,助力跨越数字鸿沟
在工业领域,科大讯飞今年获得了DCASE全球工业声纹挑战赛冠军,机器可以听懂各种设备的运转是否正常,听懂各种产品是否噪音超标或有瑕疵。
结合听觉、视觉、触觉、嗅觉、味觉,我们形成AI大脑的第六感,我们叫它“工业六感”。在工信部、国家制造业创新中心的支持下,依托国家智能语音创新中心这一平台,我们要打造工业六感创新产品和测试的全国制高点,也欢迎大家加盟这个领域,从而推动整个工业互联网的发展。
我相信,工业六感将构建整个工业互联网最核心的底层能力,赋能传统产业高质量发展,更好地助力中小企业跨越数字鸿沟,为工业互联网的开发者提供英雄的用武之地。
在工信部及安徽省委省政府的支持下,我们推出了羚羊工业互联网平台,通过AI+大数据精准匹配和技术经理人深度对接,实现海量工业互联网应用和海量需求的高效对接,打通企业“研产供销服管”全场景需求,助力企业数字化转型。
现在羚羊工业互联网平台上已汇聚超过22.6万用户,累计服务企业次数超过45.5万。
羚羊工业互联网平台既可以通过AI以SaaS服务的方式在课后服务、翻译这些通用的办公管理和营销场景上帮助中小企业,也可以通过工业 SaaS以工业数据包、数字化工具包来连接人、财、物、事,让中小企业站在数字化平台上来创业创新。对行业龙头企业,工业大脑以人工智能+RPA的方式,通过工业流程自动化来帮助企业减负增效,提供创新能力。
羚羊工业互联网平台将以数据安全为基础,以工业六感、工业AI平台、工业数据平台为特色,提供场景、政策、技术、金融的全方位赋能,让工业互联网开发者成为未来的领头羊!
幸福中国、工业强国与人工智能进展息息相关、密不可分。但人工智能领域如果只有核心技术难以实现这两个梦想,还需要生态伙伴的共同成长和繁荣。
一个新兴产业的发展,最核心的不是概念、不是纯粹的技术创新,而是洞察到未来社会发展的真正刚需,通过价值创造来创业创新,路才会越走越宽,以刚需+代差形成中国人工智能产业在全球的群体优势。
科大讯飞将和所有开发者、Z时代的合作伙伴们一起,积极投身于人工智能发展大潮,通过源头技术创新、通过系统性创新、通过生态,定义未来。
洞察未来最好的方式就是创造未来,我相信,在我们的共同努力下,人工智能一定会以解决人类刚需而被更深刻地载入史册。