新闻资讯
基于语音识别的声控鼠标的设计方法
发布时间:2021-08-29 21:51
  |  
阅读量:
字号:
A+ A- A
本文摘要:概要:构建了一种基于语音辨识技术的声控鼠标光标应用程序,可以用语音掌控鼠标光标移动到屏幕的给定方位,能用来协助残疾人士要用声音而不必鼠标和键盘就能操作电脑。分析了语音掌控鼠标光标用于过程中的延时缺失,并作出了针对性的改良。

ror体育

概要:构建了一种基于语音辨识技术的声控鼠标光标应用程序,可以用语音掌控鼠标光标移动到屏幕的给定方位,能用来协助残疾人士要用声音而不必鼠标和键盘就能操作电脑。分析了语音掌控鼠标光标用于过程中的延时缺失,并作出了针对性的改良。  1阐述  电脑语音技术经过多年发展早已获得了巨大进步,目前早已有一些产品和项目让人们有机会和计算机展开语音交互工作,例如IBM公司的Viavoice系列软件以及微软公司的新的Office产品都有简单的语音功能,可以展开语音问答载入文字等工作,还经常出现了一些基于语音技术的应用于系统。

  语音技术尤其是语音辨识技术的发展,使人们有可能构建用语音掌控电脑,这对于世界上众多无法方便使用传统的鼠标及键盘的残疾人士有根本性的意义;另外在一些场合不方便操作电脑但又必需用于的情况下某种程度很有意义,比如驾驶员的同时查找电子地图。目前要确实掌控一台图形界面的电脑,必需做用于语音掌控也能像用于键盘和鼠标那样输出数据以及掌控光标。因此一种有效地的语音掌控光标程序,也就是可以定位在屏幕的给定方位,并且可以仿真单击、双击拖拽等各种鼠标动作的语音控制程序,对于构建语音掌控电脑将是一个很有意义的工具。  本文利用微软公司的SpeechSDK5.1免费的语音辨识引擎和仿真鼠标技术,用Delphi7.0构建了一个语音掌控鼠标应用程序,可以构建语音掌控鼠标移动、暂停、单击等动作超过掌控屏幕光标的起到,并对语音掌控鼠标程序中的延后问题展开了分析,明确提出并构建了一种改良方法。

  2基于语音辨识的光标掌控类型  目前有两种语音掌控鼠标的模式:一种是目标导向光标掌控和方向导向光标掌控[n].对于前者,用户必须用语音得出明确目标名称或者方位,比如图标、菜单,或者屏幕区域名称,然后得出继续执行的命令如单击等,这种方式对于单个软件还是有效地的,但是当目标减少的时候用户必须记忆很多目标的名称,还有可能经常出现同名称目标的情况,因此工作中的错误率不会减少。另一种方向导向光标掌控又分成非倒数掌控和倒数掌控两种,对于非倒数的情况用户要同时解释方向和距离,如命令左8厘米,那么光标就向左移动8厘米;而对于倒数的情况用户再行解释方向如向左,光标就向左移动,直到用户再说暂停,光标才暂停运动。

ror体育

  本文辩论的声控光标是归属于方向导向中的倒数掌控,这种鼠标掌控和日常的用于习惯较为完全一致,用户用于一起较为适应环境。  3构建  本文语音掌控光标程序的语音掌控是使用微软公司的SpeechSDK5.1的语音辨识引擎及其API模块,这是一个免费的开发包,并且可以用它研发具备中文语音功能的软件。语音辨识引擎一般来说可以分成两种工作方式,一种就是命令掌控(CommandandControl)方式,这个方式下语音辨识引擎可以辨识结尾的语音命令,以便继续执行适当的程序;另外一种是倒数问答方式,这个模式下语音辨识引擎要辨识倒数的语音,这种功能构建一起比语音掌控更加简单,因为语音问答过程中必须对上下文以及完全相同相近发音的词语展开分析、做出辨别,而在命令掌控语音方式中不必须不作上下文分析。本文使用的是命令掌控方式,因为构建语音掌控鼠标只必须对受限的几个结尾的命令展开辨识,如左、右、停车等。

图1是语音掌控鼠标程序的结构图。▲图1语音掌控鼠标程序结构  该应用程序主要还包括两个部分:第一部分语音掌控应用于主程序部分,主要调用语音辨识引擎辨识用户的语音命令。


本文关键词:基于,语音,识,别的,声控,鼠,标的,设计,方法,ror体育

本文来源:ror体育-www.5nuo.com