[导读] 国际知名数据咨询公司IDC预测:2020年,中国将有1亿用户使用语音交互功能,未来将实现V2E,即Voice to everything。无论家用电器、汽车、办公设备都将逐步嵌入语音模块,推动中国第三次互联网变革“语音互联网时代”到来。
国际知名数据咨询公司IDC预测:2020年,中国将有1亿用户使用语音交互功能,未来将实现V2E,即Voice to everything。无论家用电器、汽车、办公设备都将逐步嵌入语音模块,推动中国第三次互联网变革“语音互联网时代”到来。同时,随着面板技术、计算架构、交互技术等多方面的变革,会影响产品终端形态的再定义。包括带屏幕的智能音箱,TV与嵌入式白板、小系统与中控装置等,越来越多新元素、新技术正在冲击传统形态的消费终端产业。
从音箱到万有,从算法到芯片,对话式AI正在不断突破技术的桎梏、不断探索应用的边界。我们称之为“语音交互2.0时代”。
5G带来云端交互内容无限便捷的同时,也引起了用户对于数据安全和个人隐私的担忧:“我希望能及时获取最新的流行音乐,但我并不想让大数据知道我每天10点关灯睡觉。”而对于应用开发者而言,也一直在不断表达矛盾又真切的需求,“既希望最小成本完成AI开发,又希望未来提供无限升级的空间。”
基于以上,思必驰为AIoT智能硬件终端,如“空冰洗”、厨电、灯控及晾衣架等,提供了“两低一高”(低成本、低功耗、高性能)的新选择:基于自研的AI专用芯片TH1520,模块化封装全链路智能对话技术,配套双麦算法模组,提供一站式Turnkey离在线方案,集成鲁棒降噪、回声消除、离在线识别、近远场全双工交互、就近唤醒等能力,且支持自编译功能、多格式解码和OTA升级,最快3周完成对接到落地的全过程,“我们提供更好的AI技术服务,也尊重终端用户绝对的数据安全。”
技多不压身,定制超自由
当前,智能硬件设备对接语音交互能力,对AI性能的追求仍然是第一位,包括信号处理、鲁棒识别、自然交互等。
思必驰离在线模组方案,采用自研AI专用芯片TH1520,集成思必驰优秀的全链路智能对话技术并进行模块化封装,支持双麦阵列设计,针对家居场景下的智能硬件量身定制。家居噪音环境下,5米远场唤醒率>95%,识别准确率>92%,误唤醒仅1次/48h(国际认可1次/24h为优秀水平);支持唤醒词自定义,可内置本地指令数百条,响应时间<500ms;背靠DUI平台,可自选对接天气、音乐、故事、百科、新闻等海量技能,云端服务无限制。
语音交互中,离线与在线各有其优点和弊端。离线交互实现的功能受限,但好处是无需联网、响应快,且数据本地化处理;云端交互虽然支持的说法自由且更广,但也容易出现数据处理速度慢、同音字词影响成功率等问题。融合离在线的双模式混合交互是大趋势,一方面需要确保离线交互快、多、准,确保在线交互广、灵、优,同时还需要让系统能够智能决策离在线的处理方式。
助理”。目前,在业内能够支持全双工功能的语音模组较为罕见,在中低端芯片上实现全双工更是一种挑战。然而,思必驰离在线模组方案,已成功升级全双工能力。通过“打电话式”的人机交互,源源不断同时进行的语音上行流和下行流,支持连续交互、动态断句、语义打断、噪声拒识等功能,以满足终端用户更真实自然的交互需求。
大势所趋的智能家居风潮,“入口级”硬件终端各展神通,但相近的唤醒词,往往容易出现“一呼百应”的尴尬。思必驰离在线模组方案,通过“就近唤醒”来解决这一难题。不同于业界GPP的实现办法,思必驰离在线模组方案的“就近唤醒”是基于DSP来实现的,处理性能更优秀:哪台设备被唤醒,并非简单的取决于与用户距离的远近,而是依据哪台设备所接收到的正面声能更多。这就避免了用户面对着空调说“太热了”,但沙发边的音箱却抢话“我听不懂”的尴尬情况。
同时,若同个环境下有多个设备采用本模组,唤醒后的设备可以控制其他硬件的联动功能,实现多模块协同,如“命令客厅的空调控制阳台的晾衣架”。思必驰用语音实现万有交互,帮助厂商打造全屋智能。
思必驰离在线模组方案所采用的主控芯片TH1520,由思必驰联合中芯聚源成立的子公司——深聪智能,独立自研,它于2019年1月正式发布,于2019年7月量产。
TH1520是一款AI专用的双核增强型低功耗DSP芯片,集成思必驰语音算法,大容量片内静态存储,多通道音频解码支持广域采样率,为上层Wi-Fi芯片端的工作减轻压力,为开发者留出更多上层逻辑应用开发的空间。
数千小时实测,思必驰离在线模组在待唤醒状态下功耗仅约150mW,而在正常工作模式下功耗也不超过750mW。同时,基于TH1520芯片的自编译平台已就绪:使用思必驰离在线模组方案的开发者们,可根据实际需求在平台上自行配置唤醒词和命令词,1分钟即可出配置文件,极大缩短了个性化定制的技术需求沟通时间。
深耕AIoT数年,思必驰深刻理解硬件厂商和开发者的需求,“清晰的需求本地化,复杂的功能云处理”,共性剑指高性能端到端的人机自由口语交互。
对接零门槛,拓展无界限
除了算法性能,方案等软硬件适配性、对接难易度、未来拓展性也是智能硬件厂商尤为关注的方向。
基于高性能的双核增强型低功耗DSP芯片TH1520,打通思必驰全链路智能对话交互技术,配合研发团队的数月优化,思必驰离在线模组方案同时具备以下优势:
多格式解码:配备多通道音频编解码器,在DSP芯片上能够处理支持广域的采样率范围,内置EQ调节,且支持MP3、ACC、M4A、M3U8等主流高清音频格式解码。
OTA升级:背靠DUI平台,在线技能可不断扩充,设备控制、影音视听、信息搜索、儿童读物等内容可自由选择对接。多版本管理增量云端热更新,助力应用快速成型,减轻开发压力的同时,给予用户最顺滑的智能体验。
落地速度快:硬件厂商及开发者只需列出本地词条和通信协议,集成完后进行测试即可,从项目开始到落地,通用方案对接可实现最快2周完成验证发布。
方案多样化:针对品牌白电厂商、小家电方案商、运营商、行业客户、海外厂商、中小型开发者的不同需求,思必驰推出多种离在线模组方案版本选择,包括SDK、算法系统方案、芯片方案、模组方案、整机方案、Amazon AVS定制版、运营商定制版、行业场景定制版等。
品类应用广:离在线模组仅65mm*50mm,低功耗、低发热,可以轻松嵌入各类家用电器之中,包括白电厨卫(如空调、冰箱、洗衣机)、卫浴设备(如魔镜、马桶、晾衣架)、客卧小家电(如扫地机器人、净化器、台灯)等。
未来正在到来,在5G+AIoT时代趋势下,会报菜谱唱歌的冰箱、可以播报每日气象信息的空调、能够语音选择洗涤模式的洗衣机、能给孩子讲睡前故事的台灯等等,这类耳聪口俐的智能设备会越来越多,并将在我们的家中扮演越来越重要的角色。
沟通万物、打理万事,是思必驰的愿景蓝图,也是基于TH1520芯片离在线模组方案的力之所向。
附:思必驰离在线模组方案规格说明书