编者按

思必驰是国内领先的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发新一代人机交互平台与人工智能芯片。陈苇珍女士针对思必驰技术优势、全屋智能和多模态的应用方案进行了深度的分享。思必驰整体业务围绕“云+芯”重点布局,“云”即“DUI”,“芯”即“AI芯片”,正在针对智能终端和企业服务,提供软硬一体化的解决方案和全渠道的智能对话服务。


陈苇珍
思必驰IoT商务总经理

图片物联网社会的三层分工

陈苇珍女士首先谈到:物联网时代,底层是基础软硬件和算法方案,同时包括传感和操作系统;其次是交互层,交互层主要用于感知和认知以及表达;最后是应用层,具体落地到智能家居、智慧酒店、智慧地产等不同场景中。

思必驰交互层的系统服务商,主要将基础层和应用层起来连接。

赋能车联网、IoT以及众多行业场景

思必驰经过十几年的市场耕耘,为车联网、IoT、以及众多行业场景合作伙伴提供自然语言交互解决方案,同时不断丰富后端服务资源,满足用户的多样化需求。除原有的领域外,思必驰逐渐将业务领域扩展到金融、政务、医疗、物流、房产、酒店等新场景。

打造全链路的语音交互定制

思必驰不仅关注语音控制,更关注人机对话式交互,多轮交互、打断纠错等技术处于国际领先水平,为产品提供专业深化的场景解决方案,为企业提供启发式对话的智能服务,同时开放DUI全链路智能对话定制平台,推进语音语言技术的应用规模化。

为何做全链路定制?因为近几年来,语音市场快速发展,客户的个性化需求增多,定制需求量逐步增加。

2017年,思必驰,在多年智能语音技术基础上,以Dialogue为核心,结合GUI和VUI,自主研发了全链路智能对话定制平台DUI,为开发者提供高可用定制的人机对话技术服务,为智能终端开发者提供核心交互能力,协助传统设备实现智能升级。

DUI致力构建以场景服务为基础,以用户为中心的自由人机交互体验,支持自由调用图文、列表、音乐、内嵌网页等多种控件,提供从唤醒、语音识别、语义理解到对话管理、内容输出、TTS播报等全链路技术的超高度定制。

多模态交互技术的应用

陈苇珍女士表示,针对周边嘈杂干扰大、多人密集同时交互的情况,思必驰结合全链路语音交互技术及自研计算机视觉技术,推出多模态交互技术方案。

多模态VAD

根据视觉和音频特征,分离出说话人的目标语音,拒识其他说话人的声音,从而实现辅助降噪、提高声源定位的精准度,即使说话人在移动状态下也不受影响。

第一个场景是当只有一位用户和设备交互时,设备会把用户这一束音频进行增强,然后对周边环境噪音进行抑制;

第二个场景是当用户唤醒设备交互时,旁边也有人在说话,设备通过多模态VAD,把非唤醒人的声音做拒识别做判断,只是对有效的一束声音做意图判断;

第三个场景是当用户在唤醒一个设备后,用户没有做好交互的准备,周边同时又有人在说话,也是通过VAD处理,设备不会做更深入的交互;

第四个场景是用户在和设备做交互,但位置在快速移动走动,也可以对用户的一束声音做增强。

人脸识别&人脸对比

人脸场景已经在一些智能家居场景中落地,比如现在常用到的智能家居中控产品音箱和面板,通过人脸ID的比对和识别,可以实现几大场景。

第一个场景是人脸对动作和关键特征的判断,例如用户离开家,面板识别可以提醒是否带戴口罩,或者当用户回到家时,能够识别出用户的情绪情况,识别到主人疲惫,带给用户一段舒缓的音乐,以及把你的灯光都调成比较平和的方式。

第二是基于Face ID的比对,面板的控制后台以主人的Face ID作为控制账号,其他人使用这台面板时,会被提醒不是业主,没办法改动设置。

手势识别

第三个场景是手势识别,最简单的场景是电视,用户不想用语音控制,也不想找遥控器,可以通过手势来换台。音箱设备使用中,当有电话进入,要把音乐停下,可以做按压的方式让设备停止播放。

思必驰全屋智能解决方案

从2018年开始,越来越多的硬件和产品,提出了语义功能的要求,简单分成36个大类:小到开关和灯,大到空调、洗衣机,覆盖客厅、卧室、厨房、卫生间、走廊等多场景。

全屋智能语音的场景,包括桌面智能音箱对整个家居的控制,如门窗遮阳系统、空洗产品、智能照明和暖通环境等多个细分场景。

全屋智能是大趋势,家里语音智能的设备也越来越多,思必驰不得不做出更多灵活的多设备联动唤醒的产品。

当家里有多台设备时需要唤醒它,如何保证唤醒设备是用户想要的,主流的解决方案有几种:一是语音和视觉的多模态方案,通过综合判断,比如交互时唤醒者是否看向它,作为一个判断的依据;二是根据语义理解,比如看电视,用户说“看刘德华的电影”,这个时候响应不应该是音箱而是电视;三是最主流的就近唤醒方案,适用于多台设备和用户距离都相近的情况下,保证设备被唤醒的唯一性和精准性,能够实现每台设备之间可以相互控制。

除了家庭环境内将语音智能打通连接之外,思必驰也连接了电梯和门禁系统,比如用户说“我要下楼”或者“帮我开门”的场景。

对接物业管理系统,从非常简短的接受物业的通知,查看物业的活动,再到一些日常家居的保修服务,如业主语音查询费用、快速报修,终端上一键预约家政服务、查看社区活动、接收所有物业通知、及时反馈需求,实现快捷便利贴心的家-服务场景闭环。

下一步,思必驰会联合地产商以及物业商去做周边社区的服务打通,打通社区现有的社区生活服务,终端触达直接入户,实现服务价值与自身效益轻松最大化

除了设备控制的场景之外,在DUI平台上,思必驰也提供丰富的家庭生活技能,包含影音视听、汇率查询、日常百科、会议查询、闹钟设定、天气查询等,极大的丰富用户的智能家庭生活体验。

晓听乐连

晓听乐连是思必驰赋能的智能音箱及其他智能设备的配套APP,帮助设备完成设备配网、账号授权,音乐等有声内容推送、智能家居控制、音视频通话等,APP中结合了大量的内容,包括100家家居平台,都可以通过晓听乐连应用进行连接。

思必驰全屋智能解决方案集合了括音箱、面板、APK、智能场景、智能服务,提供集智慧屏+智能语音面板+IoT设备+智能安防+智能场景+IoT APP 软硬件一体的精品化全屋智能解决方案。

采访手记

思必驰作为对话式人工智能平台,基于AI语音技术,正在构建更加广阔的平台互联,全链路可定制的能力在语音赛道上一骑绝尘,在全屋智能全场景环境中,思必驰正在打造更灵活的多设备联动唤醒机制,同时结合视觉、手势、传感等新技术,将逻辑深化、交互简化。未来,能听、会说、能思、会判的全屋智能指日可待。

免责声明:凡注明为其它来源的信息均转自其它平台,目的在于传递更多信息,并不代表本站观点及立场。若有侵权或异议请联系我们处理。

相关推荐