Shvoong首页 > 互联网 & 技术 > ARS和TTS技术在外语口语教学中的应用研究

.

ARS和TTS技术在外语口语教学中的应用研究

Review by : TsingHua
浏览次数 : 28  词语: 300   出版日期: 二月 20, 2006
1971年,DELLHYMES(海姆斯)第一次提出了交际能力(COMMUNICATIVE COMPETENCE)理论。在过去20年间,该理论对于外语教学产生了重大影响,学生的交际 能力越来越受到重视。提高学生的口语能力是外语教学中的重要一环,这就要求教育者为学生提供 更多的交互式的语音训练实践机会,提高其口语交际的能力。语音识别技术作为一种新的外语辅助 教学的手段,是学生口语学习中非常重要的辅助手段。1语音识别技术语音识别技术是使用计算机 能识别和理解的语言,把语音信号转变为相应的文本或命令的过程。语音识别是一门多学科交叉技 术,也是2000年至2010年间信息技术领域十大重要的科技发展技术之一。语音识别技术主 要包括两个方面:ARS和TTS,本文着重对ARS进行理论方面的介绍。目前国内语音识别技 术研究具有代表性的研究单位有清华大学电子工程系与中科院自动化研究所模式识别国家重点实验 室。当前,我国语音识别技术的研究水平已基本上与国外同步,在汉语语音识别技术上还具有一定 的特点与优势并达到国际先进水平。国内研发的第一块语音识别专用芯片,包括了语音识别、语音 编码、语音合成功能,可以识别30条特定人的语音命令,识别率超过95%,其语音编码速率为16KBITS/S。该芯片可以用于智能语音玩具,也可与普通电话机相结合构成语音拨号电话机。2AR S(AU TO)语音识别技术原理ASR(AUTOMATED SPEECH RECOGNITION),即自动语音识别技术,它是一种将人的语音转换为文本的技术。语音识 别技术运用了声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科的知识 和技术,因此它是一个多学科交叉的技术。由于语音信号的多样性和复杂性,所以目前的语音识别 系统只能在一定的限制条件下才能达到满意的性能,或者说只能应用于某些特定的场合。语音识别 简单的说就是一个语音信号导致听众做出相应的反应,语音识别成功的关键是接受者可以根据收到 的指令做出正确的反应,这样才可以完成正确的互动作用。众所周知,认识和理解人类语言需要大 量的语言学知识:语音,词汇,语义,文法,语用学所构成的一个语言体系,计算机在语音识别方 面还无法达到人类的水平。这是由于人类和机器处理语言的方法有着巨大的差别。在处理复杂语言 的识别过程中,人类可以使用声学信号与其他的感觉如视觉和联想等方法一起去理解问题;而对于 计算机语音识别过程就是对一系列数据进行处理。相比之下,计算机则在一些有限制的语言范围内 可以做得很出色如天气预报声讯查询系统等。然而,尽管两者差异如此之大,语音识别的核心问题 对两者而言是相同的,那就是对给定的语言做出正确的语言反馈。自动语言识别技术就是试图利用 计算机模拟人类的语言反应同时进行优化。自从70年代以来,人们已经提出了许多关于语音识别 技术的解决方案,语音识别所应用的模式匹配和模型训练技术主要有动态时间归正技术(DTW)、隐马尔可夫模型(HMM)和人工神经元网络(ANN)等。HMM(HIDE MARKOVMODE)模型是语音信号时变特征的有参表示法。它由相互关联的两个随机过程共同 描述信号的统计特性,其中一个是隐蔽的(不可观测的)具有有限状态的MARKOV链,另一个 是与MARKOV链的每一状态相关联的观察矢量的随机过程(可观测的)。隐蔽MARKOV链 的特征要靠可观测到的信号特征揭示。这样,语音等时变信号的某一段的特征就由对应状态观察符 号的随机过程描述,而信号随时间的变化由HMM链的转移概率描述。模型参数包括HMM拓扑结 构、状态转移概率及描述观察、符号统计特性的一组随机函数。此外,人工神经元网络在语音识别 中的应用是现在研究的又一热点。ANN本质上是一个自适应非线性动力学系统,模拟了人类神经 元活动的原理,具有自学、联想、对比、推理和概括能力。这些能力是HMM模型不具备的,但A NN又不具有HMM模型的动态时间归正性能。因此,现在已有人研究如何把二者的优点有机结合 起来,从而提高整个模型的正确性。以上几个模型中尤以HMM技术更为被推崇,该模型是把统计 和概率性计算应用于音节相匹配的模式。HMM方法经大量试验证明是很有效的,特别是对于要求 较高的,涉及到大量词汇的语音识别时尤其出色。因此目前大多数商业系统都采用这个技术。下面 ,我们将着重讨论关于HMM的相关技术问题。一个基于HMM的语音识别系统由5个部分组成: ①语音录入分析器,对输入的语言进行声音的处理分析;②声音模型,通过使用大量的实际语音数 据训练系统并将其保存系统中便于以后的数据识别;③词语生成器,把相关的词素相连接组成单词 ;④统计模型或语法模型把相关识别出来的单词按照一定的语法规则组成句子;⑤译码器把接收到 的语音信号与产生的相关词句进行匹配以求可以找到最佳的输出结果。图1显示语音识别系统中各部分的功能及其相互作用的关系。3TT S的技术TTS(TEXTTO SPEECH),即文语转换,又称为计算机语音合成,它的实现过程和ASR刚好相反,是把计算 机中任意出现的文字转换成自然流畅的语音输出。一图1语音识别系统的组成般认为,语音合成系 统包括三个主要的组成部分:文本分析模块、韵律生成模块、声学模块。该技术的关键是建立完整 成熟的语料库。从实现上来说比较简单,因此,目前TTS技术已经可以达到商业化的地步。下面 可以看到应用ARS和TTS技术的相关实例介绍。4语音识别技术的应用语音识别技术的应用目 前已经进入产品化阶段,比较著名的产品有微软公司的语音识别软件,以下我们将介绍一下微软的语音识别软件的使用:4.1M ICROSOFT语音识别软件语音识别功能需要通过三个不同组成部分的结合使用方可实现。首先,必须具备W INDOWS XP SERVICEPACK 1,并安装M ICROSOFT SPEECH RECOGNITION ENGINE(SRE)V5.0,然后使用一种能够介绍语音输入信息的应用程序。这类应用程序包括记事本、OUTLOOK EXPRESS以及W INDOWS XP中的其它类似产品。在该类应用程序的工具菜单下有语音选项,点击该选项即可安装M ICROSOFT SRE。然后只需通过打开控制面板下的语音就可以来进行语音属性的设置。需要设置的有语言的选 择及对麦克风进行设置,为了使输入质量更加精确可以对机器进行语音训练,达到个人化的目的。如需了解更多关于微软的语言识别产品当前进展情况的信息,可访问WWW.MICROSOFT.COM/SPEECH。另外,微软的DR.WHO是专门研究如何解决计算机 在办公场所以外的嘈杂环境(例如汽车或人流较多的餐馆)中识别语音信息问题的。利用微软的语 音识别功能,可以进行人机对话。目前语音识别功能主要的应用是实现虚拟教学问题的回答和比较 简单的指令控制界面设计,它可以使用户有身临其境的感觉。此外,它还可以用来提高学生朗读能 力,并且可以发现很多语音方面的缺陷和问题。比如说有一些单词发音的不准确会导致计算机识别 出错误的单词,通过语音识别功能的使用,学生就可以发现自己在说英语时的一些问题并及时纠正 ,可以作为一个很好的辅助外语学习手段。同时系统中自带的TTS软件可以把现成的英语文章朗 读出来,在语音服务中有不同的声音选择如男生、女生、年长者、年轻者等,可以作为一个辅助的 听力软件,提高学生的听力,该软件系统可以帮助那些独立学习的学生自学。4.2语音识别技术 在外语辅助教学中的应用及实例目前语音识别技术已经在很多领域得到了应用,在外语辅助教学方 面已经受到重视成为很多新开发的教学软件中不可缺少的一个部分。如我们熟悉的金山词霸,就有单词发音的功能。下面两个软件都采用了语音识别技术其中较为成熟的TTS技术:口语超人和READPLEASE2003。值得注意的是这两个软件都必须使用微软的操作系统并使用本文上面对于微软的介绍的语 音服务才可以使用,也就是说它们的技术核心其实还是采用了微软的语音识别技术。口语超人:该 软件使用了语音识别技术的TTS技术可以进行英语口语训练,如:任何英文文章都可以用系统中 的语音库进行朗读,可作为训练口语的教材,还可以根据你的性别,分别教你不同的发音,是属于 智能化教学的一种。电脑会与你在不同场景和场合下,进行角色模拟,训练你快速的英语反应及对 答能力。“口语课文”目录下提供了常用短语、常用口语和常用对话等丰富的经典口语训练教程,使学习者快速掌握各种场合的口语对话。READPLEASE2003,提供了TTS,使学习者可以很轻松地从阅读文章变成听文章。READPLEASE的 特点还包括TASKBAR方式,用户可以对发声对象有很多选择,可以选择男声、女声、年长的 和年幼的等。使用READ-PLEASE的计算机学习者可以更自由地听文章,同时READP LEASE可以对多种语言进行阅读,包括英语、法语、德语、葡萄牙语、荷兰语和意大利语等语 言,用户只要下载相关的语言库就可以听到不同的语言阅读。这是该软件比较有特色的部分。5结 束语语音识别技术的不足和问题及发展方向:语音识别技术是计算机辅助外语口语教学软件(CALL)中的虚拟现实技术(VIRTUAL REALITY)的重要实现手段,随着该技术的不断完善与成熟,未来的教学软件会越来越多地采 用该技术。交互式的教学软件只有利用语音识别技术才能做到更加智能化、人性化。该技术已作为 未来教学软件特别是口语教学软件的主流技术,同时也是口语类考试计算机考的实现手段。目前T TS技术已经可以达到商业化的要求,上面我们提到的两个软件就是使用了这个技术。但我们也发 现语音识别技术特别是ARS技术目前还是有很多的问题,主要是它的识别率还不能满足人机交流时的正常语速,所以为提高识别效率,技术人员正在不断改进方法,提高识别率。目前该技术主要

More reviews about the ARS和TTS技术在外语口语教学中的应用研究
请给本文打分 : 1 2 3 4 5


评论

Read Free Summaries - Write and Get Paid

Summarize Human Knowledge on Shvoong. Join us!

------