提到“打响指”这一声音情境,你会联想到什么呢?
是电影中魔法般的瞬间,还是朋友间的轻松互动,抑或是魔术师施展魔力的时刻?在我们所介绍的新功能中,“打响指”被赋予了全新的意义。
在小米的智能生态中,一个简单的打响指动作,便能联动米家操作,成为控制设备的触发条件。这一功能基于小米的先进技术——Xiaomi HyperMind全设备思枢,实现了设备间的主动智能互联。
不同于传统的语音指令交互,打响指功能让多设备运行变得简单直接。它不仅操作流程简便,还能指令直达、主动感知,让家居环境响应你的需求。这一功能的推出,无疑是小米在声音事件感知和通用声音识别方面的重大突破。
我们选择响指声作为识别原因,不仅因为其场景特殊性,不易被误触发或模拟,更因为打响指这一动作本身就极具酷感,能为用户带来更好的使用体验和更高的识别准确度。
在设置好功能的自动化指令后,只需Xiaomi Sound音箱在开启状态下,自动、持续感知周围的环境声音。当打响指这一指令在音箱方圆3米范围内被精准识别和捕捉时,即可快速触发各类操作,唤醒准确率高达96%。
具体应用场景中,无论是触发单个设备还是多个设备,打响指都能实现一键操控。例如,在客厅打响指可开启灯光,在主卧打响指可拉动窗帘、开启空气净化器、加湿器等。这一功能还支持在不间放置音箱并关联不间的设备,设置不同的触发指令。
响指识别的算法在音箱端实现了本地部署,所有声音在音箱内即完成处理,不会上传至云端,保障了用户的隐私安全。
小米AI实验室为避免误识别进行了多项优化措施。例如,在检测到周围播放音乐或视频时,自动响指识别功能;算法对声音距离进行判断,防止窗外声音误触发等。
小米多年来在技术研发上的积累,使其从应用层面转向了底层技术层面。其中,AI领域是小米持续投入的底层赛道之一。而声学语音部门已具备从硬件到软件的基础层再到应用层的全链路声音算法能力。
音频标记技术的诞生,是小米持续研发的成果之一。该技术可识别广泛的声音,为环境中的声音赋予文字等其他模态的表达能力。
无论是言语障碍用户还是希望生活更便捷的用户,“打个响指”功能都能提供帮助。它能够主动感知、一次操作即可控制家庭设备,让生活更方便、更充满惊喜。
例如,在告白场景中,通过提前设置好设备与指令的关联,“打个响指”能在关键时刻自动执行操作。对于需要闭麦时间到或需要在不间执行不同指令的用户来说,“打响指”功能也提供了极大的便利。
音频标记技术是小米AI实验室研发积累的基础技术之一。除了“打响指”功能外,它还能识别上百种自然声音。小米AI实验室也在不断倾听用户需求、不断创新技术,为更多人带来智能化的科技生验。
音频标记技术还应用于“小米闻声”等无障碍产品中。它能够监测对听力障碍用户重要的环境音并进行文字推送通知等操作。
去年9月,小米的音频标记算法在国际学术界上取得了突破性成绩。该模型虽参数量仅为同行的约十分之一,却仍在性能上领先同侪。此外该研究成果也已公开发布给学术界共享。
未来,我们将继续探索技术的边界与可能。让“打响指”功能覆盖更多机型和载体上支持多设备协同操作等新功能探索中我们看到了无数可能性。同时我们也希望我们的产品和服务能像“最酷的产品”一样带给人们更多乐趣与便捷。