蘑菇车联致力于打造全场景语音交互车载OS,实现全新的人车交互体验

来源:江西网络广播电视台 编辑:华瑞 发布: 2019-10-19 20:11

“最自然的交互才是最好的交互,车内场景下语音交互才是最自然的交互,蘑菇OS从设计的第一天开始就致力于打造全场景语音交互的车载OS。”2019年10月18日,蘑菇车联副总裁、蘑菇OS部总经理邓志伟在第二届汽车人机交互与智能座舱国际峰会上表示。

蘑菇车联副总裁、蘑菇OS部总经理邓志伟

从工业革命到信息革命,随着机器智能的飞速发展,人与机器之间的交互经历了数个时代的发展。从最早的机械操作到物理按钮和触摸屏,移动电话的出现进一步推动了过去20年中最大的一次人机交互变革。所见即所得的触摸交互极大地提高了人与机器的交流效率,为终端场景下的人机交互方式提供了最佳的用户体验。

随着车联网、物联网的蓬勃发展,人机交互方式面临了全新的挑战。在传统的手机触摸屏操作时代,由于人类视觉、听觉、触觉是完整释放状态,因此90%的触摸屏交互加上10%的语音交互带来了移动终端时代的完美体验。而在车联网、物联网时代,由于操作环境和机器的复杂性,人体的自然感处于限制状态。特别是在车联网,视觉和触觉都在驾驶舱环境中受到很大限制。在如此复杂的受限环境中,语音交互成为在车载场景中进行交互的最佳方式。

在过去的几十年中,车企一直致力于为用户提供更好的交互体验,例如奔驰首次提出方向盘按键和鼠标触摸板、 奥迪 MMI、和宝马 idriffer智能驾驶控制系统都极大地促进了人车交互的变革。信息时代和人工智能的技术突破为行业带来了更多机会。

“在这样的时代背景下,蘑菇OS的交互设计理念就是为用户提供最好的交互体验。”邓志伟表示,“蘑菇OS打造的全场景VUI(Voice User Interface),将从目前90%的语音辅以10%的触摸交互,演进到最终实现100%的全语音交互。”

“语音交互最大的难点在于语音识别与语义理解,泛场景化的语义理解一直是业界最大的难题,即使机器学习的出现也不能解决泛场景化的连续交互问题。这也是为什么大家在使用手机、音箱等包含语音交互的终端场景里面始终感觉语音交互体验不好,人工智能比较‘傻’的原因。”邓志伟现场坦言,泛场景化语音交互场景依然面临严峻的理论难题与体验缺陷,“但是在车载领域,我们迎来了全新的机会,由于车载场景封闭化、场景化、归一化的特点,使我们在车载领域实现全场景语音交互的优质体验成为了可能。”

“目前蘑菇OS的用户月语音交互次数已经突破了三亿次,我们发现80%的语音交互内容出现了惊人的场景相似性,这为蘑菇OS的全场景语音交互带来了巨大的启发。”

蘑菇OS的VUI,定义了两大类语音包场景:通用语音包服务与个性化语音包服务。

通用语音包服务通过用户相似性场景的集中抽象,通过渐进理解、意图跟踪、智能纠错等技术的运用,对用户的意图进行场景化分析,目前已支持涵盖车辆控制、娱乐、安全、生活服务、信息等5类需求81个细分场景;通过大量模型训练与机器学习,配以底层语音引擎技术,能够迅速理解用户意图并提供精准反馈;通过场景引擎的定义,支持上下文多轮对话,能够实现边听边说边想,大幅缩短响应时间,用户可随意插话,更贴近人们日常交流习惯。蘑菇通用语音包服务的理解准确率超过97%。

蘑菇OS的VUI同时推出了个性化语音包服务,可以通过声纹识别、声源识别、语言及语调识别,满足个性化服务需求。通过声纹识别提供定制服务,包括空调温度、座椅角度、音乐喜好等;通过声源识别用户位置,当识别到“调低温度”指令时,即可调节声源位置的温度;此外,个性化语言包系统还可通过语言及语调识别用户情绪,实现差异化内容回复。

在百年的汽车发展历程中,汽车产业的先驱们在不断的探索人与车的交互方式,力争打造最优质的人车交互体验。邓志伟表示,“人工智能时代的到来,给产业带来了新的机遇,蘑菇OS期待沿着汽车产业先驱探索的步伐,与车企的伙伴们一起打造信息时代全新的人车交互体验!”

提示:本页面内容及观点仅供传递信息用,不构成任何投资或具体行为建议,本网站对所引用信息的准确性和完整性不作任何保证。如有侵权,请联系邮箱heimalaodou@163.com

猜你还想看: