[导读] 目前,科大讯飞已和新华社、人民日报、光明日报和央视等多家媒体达成合作,探索人工智能+媒体的多种可能。
从2014年起,每年如约而至的世界互联网大会让乌镇这座千年水乡碰撞出别样的精彩。在古老与未来中穿梭,聆听最前沿的真知灼见、见证最新鲜的科技狂潮,中国声音有力贯穿了全球互联网发展。
11月7日,第五届世界互联网大会拉开大幕。历经互通、创新、共享等主题后,今年大会聚焦“创造互信共治的数字世界——携手共建网络空间命运共同体”,全球国际组织负责人、互联网领军人物悉数到场,就多项议题展开讨论。在今天举行的“媒体变革与传播创新”论坛中,科大讯飞董事长刘庆峰出席并发表演讲,揭晓人工智能究竟如何赋能媒体创新。
能听会说,让TA的内容又快又好
想要携手创造互信共治的数字世界,以及更具生机与活力的网络空间命运共同体,肯定缺少不了媒体这一关键参与者和推动者。媒体作为沟通和传播的桥梁,A.I.能为TA带来什么改变呢?
“今天是记者节,我看到很多记者朋友在用讯飞听见。为了让大家更好地在噪音环境下使用,讯飞又专门发布了转写机器人——讯飞听见M1,这将会帮助记者们减轻负担、提高效率”。
演讲恰逢记者节这一特殊的日子,刘庆峰向大家介绍了讯飞听见M1转写机器人,不仅能够轻松拾取10米以内有效声音,面对噪声、混响等情况依然表现出色,1小时的录音5分钟就能转成文字稿件,且识别准确率高达95%,可以让记者们的工作更加轻松高效。
要实现这样的目标,语音识别、语音转写等技术必不可少,这也是讯飞的使命“让机器能听会说、能理解会思考”中的前半部分——能听会说。在“听”上,科大讯飞的语音识别与转写技术不断精进,从2015年讯飞年度发布会上成功PK速记员,再到今年全国两会,人民日报新媒体中心已现场使用讯飞听见进行转写。
“万物互联时代,语音识别对噪音、口音和远距离等因素会有更高的要求,讯飞的技术还有很长的路要走”。除了为记者朋友提供更高效的转写服务,刘庆峰还表示,语音识别技术还能实现对音视频的快速检索,对大量媒体资源能起到盘活作用。“我们的技术面向各类媒体平台还有更多的合作空间”。
除了拥有一双灵敏的耳朵,人工智能还能赋予媒体一张神奇的嘴巴。科大讯飞已蝉联国际语音合成大赛十三连冠,并成为自然度这个重要指标唯一达到4分的团队,“这意味着机器说英语已经达到了美国大学生的平均水平,读汉语也达到4.5分”。凭借过硬的语音合成技术,讯飞已和央视、南方财经全媒体集团等联合打造人工智能虚拟主持人,“复活”了央视已故配音大师李易老师的声音、打造了首个A.I.全程配音的纪录片《创新中国》;正在举办的进博会上,讯飞为大会吉祥物“进宝”量身打造了声音用于新闻播报。
能理解会思考,让TA的声音更响亮
伴随着技术的拓新,全球信息的交流也愈加频繁、深入,语言的差异却成为横亘在信息互通之间的一座“大山”。想要在万物互联的未来实现无缝沟通,机器翻译的力量不可小觑。
“在最近刚结束的2018国际口语机器翻译评测比赛中,科大讯飞不仅拿到了全球第一,还受邀在大会上作了报告。但今天,机器翻译还达不到最好的同传老师的水平,不过已经能在日常生活中提供很大的帮助。”刘庆峰认为,机器翻译不仅能为不同语言的人们沟通带来便利,还可以为媒体内容的传播贡献力量:“这项技术可以让媒体的内容迅速在‘一带一路’沿线更多国家传播,也可以把更多国家的优秀内容引到中国,机器翻译一定可以助力人类命运共同体的打造”。
机器翻译离不开对语言的理解和思考,这也印证了“让机器能听会说、能理解会思考”的后半部分——理解与思考。“国际上权威的机器阅读理解大赛SQuAD,讯飞于今年1月在精准匹配率超过了人类平均水平。除了讯飞,微软、腾讯等都做出了非常杰出的贡献,我们共同推动整个技术与产业的进步。”
机器的能理解会思考,在人类的通用常识领域仍然路途遥远;但在专业领域内,辅以相关的大数据,却能发挥极大的作用,甚至超越一般的专业人士。“专业智能已经到了什么程度?在给定格式的文本下,机器已经能写稿了,比如体育报道等等。我们相信,用自然语言理解可以辅助人类写稿、审稿、校稿。”
对于不便于获取传播信息的特殊人群,人工智能也有妙招。科大讯飞推出的“三声有幸”公益计划,不仅让听障人士看见了声音,还让视障人士听见了文字,已经有几十万残障人士开始受益。“人工智能可以让公益触达各种各样的群体、抵达人心。”刘庆峰说,这也是讯飞推出并实践A.I.公益计划的初心。
目前,科大讯飞已和新华社、人民日报、光明日报和央视等多家媒体达成合作,探索人工智能+媒体的多种可能。在良好的基础上,刘庆峰对人工智能赋能媒体创新有着坚定的期许:“通过合作,可以在媒体采、编、播、审、存整个领域发挥作用,让媒体变得更加智能化、实时化,给人才释放出更多的时间,来做画龙点睛、更有创意的事情。我们期待着能和在座各位一起,用人工智能建设媒体的美好未来。