主页 > 新闻中心 > 企业新闻 >

语音交互将是未来智能家居基本操控方式

时间:2015-09-14 11:45来源:www.bjznchina.com.cn 作者:百佳智能 点击:
在国外科幻大片中,使用语音方式操控家电、门窗的桥段无处不在。例如《美国队长2》中,神盾局局长用语音操控虚拟桌面、窗帘和电视;在《钢铁侠》系列电影中,男主角回到家以后

在国外科幻大片中,使用语音方式操控家电、门窗的桥段无处不在。例如《美国队长2》中,神盾局局长用语音操控虚拟桌面、窗帘和电视;在《钢铁侠》系列电影中,男主角回到家以后,对着咖啡机说一声想喝咖啡,变开始自动冲咖啡……

武汉百佳智能系统工程技术有限公司看来,科幻片中的未来生活场景并非凭空想象,国外的IT巨头已先后在智能家庭领域中将产品与语音成功结合:Google收购NEST后布局智能家庭,不断强化GoogleNow的语音入口;国人熟知的苹果HomeKit智能家居平台与Siri也不断加强融合;微软近期也发布语音助手Cortana,为它在智能家居领域扩展交互入口。

作为人类信息最自然、最便捷的交互方式,业内人士普遍认为语音必将成为以后智能家居设备中重要的构成部分,看着国外科技大佬们纷纷投入语音产业,国内企业也按耐不住,去年8月语音巨头科大飞讯宣布进军智能家庭市场,并于今年3月牵手京东,成立合资公司,宣告双方将在智能家居和语音技术领域全面展开合作。

随着国内外企业对语音交互领域的重视,语音核心技术也得到近一步成熟,曾经的技术瓶颈正在渐渐融化。语音识别技术作为语音交互的基础与核心,它赋予了计算机系统“听力”的功能——该技术经过语音信号的处理、语音特征的处理、模型训练及解码系统等复杂步骤,使机器最终能够将语音中的内容、话语甚至的语种等信息识别出来。

(图:主流的语音识别系统框架图)

在了解完语音识别的基础内容和系统框架之后,我们一起来看看,若语音识别技术想在智能家居中广泛使用需跨过哪些困难。

1、传输距离。

目前近距离识别技术已较为成熟,以苹果siri系统为例,用户必须在里手机较近的距离说话才能够被识别,但在智能家居环境中,用户和智能终端设备的距离能有多近?例如你想命令餐厅里的吊灯打开,难不成还要爬到墙上去?所以,语音交互技术要在智能家居中得到广泛的应用首先必须解决距离问题,让用户无论站在家中哪个角落设备都能精准的识别。

目前室内的语音交互受到背景噪音、其他人声干扰、回声、混响等多重复杂因素影响,导致识别率低甚至无法使用,只能在相对安静、近距离的环境下使用。而远场识别技术将能够很好的解决这些问题。

2、效率。

近年来,随着深度学习理论的爆发式发展及其在语音识别领域获得的显著效果,同时Kaldi等开源语音识别工具也在工业界和学术界逐渐普及,语音识别的门槛持续降低,许多公司都具备了语音识别的能力及相关产品,但其实很多使用过Siri的国内用户都会有这样的感觉:Siri的反应太慢,说出一句话往往要等待很久才能显示结果,另外,准确率也不高,离好用还有很远的距离。

3、个性化。

之前网上流传一篇文章调侃韩国推出的语音电饭煲,文中描述一位女士到韩国旅游,被大篇幅的宣传画打动了,便购买了一个,等到回国准备在家人面前好好得瑟一把时,才发现这个电饭煲只认韩语!不仅如此,每个人在说话时的口音、语速、口头禅都不一样,所以一款语音智能设备仅仅只会一些基本单词是远远不够的,它们必须非常了解你,听得懂你的口音、方言、口头禅以及时常蹦出的专业词汇和英文单词。

让一台冷冰冰的设备适应用户的习惯可能吗?当然可能,如果达不到这种效果何谈智能?这里要用的到就是语音识别的另外一项关键技术--个性化识别技术。个性化识别指的是语音识别系统具备自动学习并适应用户使用习惯的能力,你用的越多,它越懂你。一般来说,个性化识别包括发音和语言两方面。其中发音个性化主要是指系统对用户语速、口音等发音习惯的学习,而语言个性化主要是指系统可以对用户的特定词汇(例如人名、地名、口头禅、专业词汇等)具备更好的辨识性。

4、方言。

中国地大物博,光民族就有五十六个,方言更是数不胜数,即使国家在推广标准普通话方面不留余力,但是,中国真正掌握标准普通话的人群比例还是少之又少,而中国的口音现象则是纷繁复杂,时常会出现同城式中不同口音的情况。因此,当这些带有或轻或重口音的人群在使用语音输入时,如果按通常的方法使用标准普通话数据进行模型的训练,就会产生很严重的适配问题,从而影响语音输入时的识别效果。

“方言”现在也不再是语音识别的障碍,得益于各类方言丰富的音频数据、特殊词汇、发音现象等专业资源以及充分利用深度神经网络的自学习特色,方言的语音识别可以得到改善。

5、语音唤醒。

鉴于智能家居节能、环保的特性,家中大部分智能设备都不会24小时保持激活状态,因此,要想在家中自由的操控智能家居设备,我们必须设定“唤醒”功能。

语音唤醒是指通过含有特定唤醒词的语音输入来“触发”语音识别系统以实现后续的语音交互。通过该技术,任何人在任何环境、任何时间,无论是近场(0.5米以内)还是远场(2~5米),面向设备直接说出预设的唤醒词,就能激活产品的识别引擎,从而真正实现全程无触控的语音交互。

除了说单个唤醒词实现唤醒外,更自然便捷、在技术上更具有挑战性的交互方式是在连续语流中带上唤醒词,以实现唤醒产品并同时实现操控的效果。目前,语音唤醒方案已在部分产品中取得成功应用。

随着语音识别技术在距离、效率、个性化、方言、唤醒等方面一一突破,人们随心所欲“声”控智能家居的时代一触即发,只不过这样的变革到底还需要等待多久?

百佳智能家居网微信公众平台:

搜索“智能百家”或扫描下面的二维码,关注百佳智能家居网微信,开启智能资讯新旅程!

武汉百佳智能系统工程技术有限公司各分部技术、业务交流群:

中央空调交流群:346988468(业务咨询热线:4006566261)

暖通交流群:373919987(业务咨询热线:4006566261)

智能家居交流群:211745240(业务咨询热线:4006566261)

顶一下
(1)
100%
踩一下
(0)
0%

他们还看了

经典施工案例

地址:中国·武汉·东湖风景区欢乐大道218号百家艺术空间(欢乐谷广场)

Copyright©2014-©2015 www.bjznchina.com.cn All Rights Reserved

网站备案号:鄂ICP备12005796号-3