智能语音输入技术——真的困难 但真的需要

2018-12-14 11:45 来源:ctimes

多年前曾有过一辆欧洲小车,这部车各方面都很阳春,但却具备语音输入的功能,可以用来播放音乐,或者透过蓝牙联机拨打手机。但可惜的是,它只能使用英语指令,而且麦克风输入、指令集操作和字词辨识的性能,都非常的差,几乎没办法做实际的使用。

但说真的,这项功能我其实非常期待,特别是一个人开车的时候,要去翻找音乐目录和开关台的功能,都是很恼人的事,尤其我并不是一个能够“多任务”的驾驶。所以如果能够用语音控制,那真是令人向往,毕竟我这个年代的人,都是对“伙计”有些期待。

最近,睡前躺在床上玩弄平板计算机,开始成为生活日常,但这种“滑”的模式用的越多,对于用手指点选字词输入的模式,就更加厌倦。此时,“Ok,Google”出现了,透过优异的语意辨识和学习功能,它完全解决我不想动的困扰。

当然这类的困扰不会只有我有,应该是大家都相当困扰。所以,当亚马逊的智慧音箱一推出,就迎来了很大的回响。因为语音,或者说语言,其实是人类最习惯的输入接口,如果可以,我希望“说动”家里所有的设备。

2-1Q214094640963.jpg

真的困难 但真的需要

但语音输入要达到顺畅的等级,其实非常困难,其背后牵涉到的组件与软硬件技术,都要有相当的优化和设计,其中最关键的,就是语音输入的误触率与辨识率,而最最困难的是如何解决人类说话的“语意”的问题。但感谢科技,现在有了人工智能和网络,这个问题似乎已不是无法克服。

所以可预期的,语音接口很快就会进入智能语音的时代,届时别说是手机、音箱和平板计算机等,家庭内的需要经常性开关的电器,如电视和电灯等,都应该会具备语音输入的功能。当然我们说的是可以实际使用的那种。

顺带一提,去年Cambridge Mobile Telematics发表一个报告,指出四分之一的车祸,都与驾驶使用手机有关。所以我们也希望语音接口技术能够改善这个情况。

责任编辑:张震