美国大型电子节目表提供商Rovi与美国大型语音识别系统开发商Nuance Communications,开始采用语音输入技术共同着手开发电视用户界面(UI)。目标是在Rovi的电子节目表中,嵌入将电视、机顶盒(STB)与智能手机和平板终端等相结合的语音输入UI。Rovi在从2012年5月21日(当地时间)开始于美国波士顿举行的有线电视(CATV)展会“Cable Show 2012”上,现场演示了试制版UI。
试制版UI将Rovi的电子节目表及电视节目和电影等的元数据,与Nuance向电视提供的云计算语音识别服务“Dragon TV”相结合,用于向用户推荐影像内容。目前正处在收集用户在操作电子节目表时,多使用何种语言等用户的自然举动的技术开发阶段。尤其是将焦点放在了用平板终端和智能手机作语音输入时,传统遥控器比较费工夫的操作上。
Rovi在现场进行了诸如语音输入“想看动作电影”,就会显示动作电影的一览表;语音输入“(将电视剧名称)放入书签”,就会将用户想要观看的影像内容保存起来的演示。经由平板终端麦克风输入的语音数据,经互联网发送至Nuance的识别系统,识别后经与Rovi元数据的数据库联动,向用户显示推荐的内容。
Rovi的开发负责人表示,“我们由迄今为止的讨论得知,语音输入在某些情况下非常有效,如传统遥控器需要摁好几下的操作,用语音音一举便可实现”。