语言学研究中的形式化方法(下)许罗迈四、斯波勃与威尔森(D.Sperber&D.Wils on,1991)的关联理论斯波勃和威尔森通过简化格赖斯的动机推理的语用理论,建立了关联 理论。首先,他们承认,格赖斯提出的通过对说话者动机进行推理,从而理解某个话语的含义是可 行的方法。推理的过程可以类比为科学研究中常见的假设、求证过程。人们在语言理解过程中如何 提出和求证假设是语用学家必须回答的问题,格赖斯动机理论的许多组成部分如关联、简洁、合作 公理(maxium)就是解答上述问题的一些尝试。斯波勃和威尔森认为格赖斯的这些公理缺乏 定义,因而缺乏可操作性。他们认为必须明确地定义某种标准,使得听话者可以从数种可能的假设 中选择唯一的最为相关的假设,从而推得说话者真正的动机。他们分析了在求证假设的过程中,环 境因素影响推理结果的四种情况:一、假设:如果外面下雨我就不出门事实:外面下雨结论:我不 出门环境因素与假设关联,因为它匹配假设的某个部分,从而完成推理获得结论。二、假设:外面 下雨事实:外面下雨结论:证实假设环境因素与假设关联,因为它直接匹配假设,证实假设。三、 假设:外面下雨事实:外面没下雨结论:否决假设环境因素与假设关联,因为它否决假设。四、假 设:如果外面下雨我就不出门事实:外面下雨,草是绿的结论:我不出门部分环境因素有助于推理 ,部分因素不必要地增加了推理中的信息处理,因此虽然仍然可以获得结论,环境因素的关联程度 较差。他们经过分析,提出了在推理过程中,环境因素与求证假设之间是否相关的两条判断规则: 1、在其他条件相等的情况下;环境因素效果最大时关联度最大。2、在其他条件相等的情况下; 信息处理量最小时关联度最大。这两条规则较好地归纳了环境因素与关联度的关系,减少了进行判 断需要考虑的因素,因而具有较高的形式化程度。尽管上述规则的表述方法并不是典型的形式化方 式,但根据斯波勃与威尔森分析的案例,计算语言学家可以容易地将第1条规则表述为:1、在其 他条件相等的情况下,环境因素匹配或否定假设的子项最多时关联度最大。第2条规则与计算复杂 性直接联系,是非常容易用计算机判断的。这两条规则把格赖斯的简洁、关联、真诚等公理所表示 的直觉性的东西改造成可以操作的东西,并取得了较高的归纳程度。例如,简洁实际上就是较少的 信息处理量,真诚也可以看作是说话者要免除听话者不必要的信息处理的一种愿望,因而也可以归 入减少信息处理量的范畴内。斯波勃和威尔森的理论把格赖斯提出的以动机推理方式理解话语的理 论推进了一步,使在推理过程中判断什么样的环境因素和推理相关有了更简单方便的操作方法。但 是,该理论并未解决如何提出假设的问题。他们的讨论都是在假设已经提出的前提下进行的,人们 在听到一句话后可以产生许多假设,根据关联理论的规则滤除可能性小的假设,只留下可能性最大 的假设。但是这许多假设是根据什么规则产生的,为什么产生某些假设而不产生另外一些假设,计 算语言学家需要有关的可操作的规则才能用计算机模拟理解话语含义的推理的全过程。五、计算机 模拟塞尔的允诺规则我们在第三节中分析了塞尔的9条允诺规则的性质,指出其中第1、2、9条 规则在计算机模拟环境下已经自动成立或隐含于其他各条规则之间的逻辑关系之中,因此我们不必 考虑为它们编写计算机规则。我们还指出塞尔的规则中不包括命题规则,即关于T映射到p的规则 ,为此我们需要从别的理论获取得有关的规则。另外,我们模拟的是塞尔的规则,其规则处理的对 象是对话双方的T和p,这隐含着一个前提,就是T和p是语言处理系统的其他模块处理的结果, 是言语行为处理模块的输入数据。我们在模拟程序中只考虑p的表达形式,而不考虑p的获取过程 ,这与塞尔理论涉及的范围是一致的。塞尔理论的核心是对话双方如何传递和识别p,我们的模拟 程序也必须把p作为主要的数据类型供各规则使用。我们采用香克(R.Schank,1977 )的概念依存(ConceptualDependency)模式表示p.CD模式是人工智能 界广为采用的语义表达式,来源于格语法(CaseGrammar),其优点不但在于能够表示 完整正确的句子、有语病的句子或省略句的语义,更重要的是它被广泛用于语言理解中的推理(i nference),是模拟塞尔规则所需要的。CD模式把句子的语义看成是由有限的、独立 于具体语言的基本语义元素构造成的语义大粒子,可以类比为化学中的原子和高分子。我们不准备 在此详细介绍CD理论,感兴趣的读者可以参考笔者的有关文章(许,1990,1991),在 此我们只说明模拟需要的几个基本语义元素。a)Mtrans,表示把某个意思传达给听话者, 有关的动词有“告诉”,“说”,“宣布”,“答应”等。b)Ptrans,表示到达、离开等 变动地理位置的意思,有关的动词有“来”,“去”,“走”,“跑”等。c)Propel,表 示对物体施加作用力,有关的动词有“打”,“踢”,“扔”等。d)Ingest,表示吸收入 体内,有关的动词有“吃”,“喝”,“吸”等。e)State,表示物体的状态,通常由“是 ”与形容词,副词等共同表示。生病是人的健康情况的一种状态,即健康低于正常状况,可用负数 表示。f)Do,表示较笼统的使某事发生,有关的动词有“举办”,“组织”等。我们用以下的 CD表达式表示我们在第三节用塞尔规则判断过的句子的命题:1)JohnpromisedM arythathehadcometoMary’sparty.cd(mtrans,[ac tor,val(john),obj,cd(ptrans,[actor,val(john ),obj,val(john),from,val(home),to,val(“mary ’sparty”),tense,val(“<now”)]),from,val(john ),to,val(mary),tense,val(<now)]).允诺是一种传达信息的 行为,所以是mtrans,所传达的p是说话者从某地到达另一地的动作,所以是ptrans ,该行为发生在过去,所以时态为<now。2)JohnpromisedMarythath ewilbeatherup.cd(mtrans,[actor,val(john),ob j,cd(propel,[actor,val(john),obj,val(fist), from,val(john),to,val(mary),tense,val(“>now ”)]),from,val(john),to,val(mary),tense,val( ”<now”)]).3)JohnpromisedMarythathewilbreath e.cd(mtrans,[actor,val(john),obj,cd(ingest, [actor,val(john),obj,val(air),from,val(open es),to,val(“jonh’slung”),tense,val(“<now”)] ),from,val(john),to,val(mary),tense,val(”<n ow”)]).4)Marywantstohaveaparty.Johnpromises Marythathewilcome.cd(do,[actor,val(mary),ob j,val(party),tense,val(”>now”)]).cd(mtrans, [actor,val(john),obj,cd(ptrans,[actor,val(j ohn),obj,val(john),from,val(home),to,val(“m ary’sparty”),tense,val(“>now”)]),from,val(j ohn),to,val(mary),tense,val(now)]).如果进一步分析塞 尔的第6、7、8条规则,我们可以发现它们只与话语行为的动机有关,属于对动机的符合常规的 推理。人们在对话时通常难以即时验证这些推理,例如玛丽一般无法知道约翰是否真的允诺参加她 的晚会,她只能姑且相信约翰是真心允诺,而验证只能留待晚会那时进行。因为如此,产生相应的 推论的时间就不必和执行前几条规则同步,也就是说第6、7、8条规则不必在判断允诺的第一时 间进行。根据这种考虑,我们在模拟程序中只模拟了第3、4、5条规则。我们的计算机规则分为 结论部分和条件部分,表示为“结论成立,如果条件成立”。第3条规则重写为程序规则就是:r ule(3,cd(mtrans,P))ifrequire(P,obj,[tense,v al(“>now”)]).它表示如果允诺的p的时态为将来,第3条规则就成立。其中p是用 CD模式表达的。我们在第三节讨论了塞尔第4条规则的不足之处,该规则未能指出S做的A在什 么情况下才是H所期望的。我们根据代尔(M.G.Dyer,1984)关于目标和因果关系在 推理中的作用的理论,把第四条规则重写为以下两条规则:rule(4,cd(mtrans, L))ifgetprop(L,obj,P)andknowledge(Cd)andinf er(subgoal,Slts,SubGoal,Cd)andconcord(Slts, SubGoal,Slts,P).rule(4,cd(mtrans,L))ifgetpr op(L,obj,P)andinfer(cause,Slts,State,P)andk nowledge(Cd)andconcord(Slts,State,Slts,Cd).规则4-1表示,如果S允诺的p和人们的常识knowledge(Cd)中具有的某种目标之间存在一致性(concord),那么第4条规则就成立,也就是说,S允诺的A和H通常追求的目标一致时,A才是H所期望的。值得注意的是,这里H通常追求的目标是通过推理(infe
More summaries about the 语言学研究中的形式化方法(下)