黄昌宁、林杏光主持:“信息处理用语言理论讲话”第六讲──蒙太古语义学陆汝占,靳光瑾语言理 论中比起句法理论更深一层的是语义理论。能适用于计算机处理自然语言的语义理论,要求形式化 而且是可计算的。可计算的语义理论中蒙太古语义学(MontagueSemantics,以 下简称MS)是最早的杰出代表。美国数理逻辑学家R.Montague在1970—1973 年间发表三篇代表作,提出著名的PTQ系统("TheProperTreatmentofQ uantificationinOrdinaryEnglish"),用数理逻辑方法描述自 然语言的语义,开辟了用严格数学方法研究自然语言语义的新方向,80年代开始流行于西方语言 学界。MS所定义的内涵逻辑对于解释语言(自然语言以及人工语言-程序设计语言)有普遍意义 ,在计算机科学理论方面也有积极作用。一蒙太古语义学产生的历史背景继Chomsky提出的 短语结构语法和转换语法之后形成了与之相关的解释语义学(Inter-pretlveSem antics,下文简称IS)和生成语义学(Generative,Semantics,下 文简称GS),用以解释深层的语义结构。IS已经注意到从词到词组最后到整句的自下而上的结 合顺序,以及从小的语言单位语义组合成大的语言单位语义的组合层次,而且还注意到语义与句法 结构之间的对应关系。这些特点在MS中都有反映。MS规定句法规则、语义规则都要符合组合原 则(Corn-positi。nalPrinciple),句法结构和语义解释之间有—一对 应关系(同构对应)。IS的不足之处在于用来表示语义的标记(Marker)是一种人工语言 ,于是自然语言的语义解释变成为将自然语言到人工语言的翻译了,实际上没有解决语义的问题, 而且标记的取舍、标记成分的构成都无确切准则。GS强调语义相对于句法结构的独立性和生成性 ,能独立生成语义表达式。动词的语义表达式是一组谓词,谓词的语义解释是什么呢?GS没有办 法说清楚,整个分析过程缺乏系统性、可操作性。这些弊端在MS中都得到了克服。长期以来逻辑 学家和语言学家都认为适用于人工形式语言描述的方法不能直接用于自然语言。蒙太古提出了挑战 性的意见,认为形式语言和自然语言之间有许多相同之处,都可以作精确的数学描述。为了证明这 一点,蒙太古着手对英语进行分析,具体地构造出一个形式系统PTQ。虽然包含的词汇很少,词 组和句型也很简单,但这是具体构造性的证明,很有说服力。对于可计算的语义理论来说,MS的 影响是深远的。机器翻译普遍采用的广义短语结构语法GPSG,其语义解释就是MS。二蒙太古 语义学的主要特点MS主要是用真值条件模型论语义学方法描述自然语言的(有关客观世界的)夕 嘟意义。强调三个原则:1.句法与语义的同构对应原则。句法分析不仅鉴别结构的合法性,而且 为语义的解释提供基本依据;2.句法规则和语义规则的递归定义中的组合原则;3.语言成分合 成时对应逻辑表达式之问的数学运算原则:泛函作用(FunctionalApplicati on)。MS正确地刻划了英语中的量饲(如Some.Every)意义,区分了内涵、外延语 义,描述了时态结构(相仿地可描述模态结构),描述了英语介词的语义特点。MS继承和融合厂 真值条件语义学、模型论语义学和可能世界语义学三种语义理论。什么是句子的意义?“真”和“ 假”两个值代表句子意义是否过于简单了?语句中各成分之间的内在联系以及它们与外部客观世界 的关系又如何反映?语句的真假值又是如何计算的?如何将语句抽象为数学表达式7对该表达式中 出现的各种符号如何解释?对于这些问题MS都给了满意的解答。例如,给出这样的语境:Joh n,Jack,wtary三个人,其中John,Jack为男人;wtary为女人。下午五 时Job。。和Mary在公园散步。语句:“Amanwalks.”要理解这句话,除了关心 时间、地点和发生什么事件之外,最需要知道的就是事件的作用者是“谁”。如果这句话说的是事 实,那就意味着语句实际上是指Tohn(下午五时在公园)散步”。事实上,时间、地点都看作 是可能世界,但是时间有点)[特别,要满足线性关系.也可单列,与可能世界并列。例句中,W :公园;T:17时。三个人是考虑问题的范围,称为论域。MS先将例句翻译成谓词公式三互( man’(x)八walk’(x》。其中八是逻辑联结词“并且”,man’、walk’都是 谓词,前者因普通名词man所指的对象不止一个,所指的是一个对象集,跟动词所指的一样,用 谓词描述。限定词A都对应逻辑存在量词3X,读作:“至少存在一个X。”于是公式读作:“至 少存在一个X,X为男人且X散步”。陈述语句如果是事实,则取“真值”。下文将介绍例句在L 述论域和可能世界W、时INt的预设(模型)下计算语句翻译成的公式是否取“真值”。如果是 ,逻辑上称为“可满足”,且能指出“谁”散步。可见“真值吁应陈述句的事实。语句取“真值” 是总的要求,语句成分之间的关系以及它们各自所指的对象需受什么关系制约,都要满足这个总要 求,这些制约关系都是可以计算出来的。反之,这些制约条件不能成立因而不满足总要求时,语句 则取“假值”。因此,语句的真值配合可能世界(包括时间、空间等物理条件)、预设的模型(包 括实体论域、对公式中出现的非逻辑符号的指派)之后构成语句的外部条件,成分的制约是内部条 件,综合起来就是语句可满足的“真值”条件,这样的语义解释是有效的,因为制约条件的计算考 虑了“充分”“必要”两个方面。顺便指出真值条件语义的真假值要比日常生活中直觉判断语句的 真假更深入一层。三蒙太古语义学的主要内容MS的精华是语义值的“计算”。依据什么来计算, 计算结果是什么?先看示意图,称为模型论解释的三步定义式,用三个箭头表示。第一步:从英语 至片断英语。片断英语(FragmentEnglish也称为部分英语,简称FE)片断英语 是自下而上定义的短语结构(消除了歧义的语言)。英语句有歧义,一句有歧义的英语句对应了几 句FE的语句,对应关系是一(句英语)对应多(句FE语句)。这里所说的英语还不完全是日常 英语,仍然受词汇量的限制,只不过是相对于FE而言的。FE的句法组成:词典(9类句法范畴 )和17条句法现则。FE的句法定义符合组合原则,从最简单成分词汇开始组合,逐层组合成复 杂成分,就像造宝塔一样地叠合。组合原则是可计算性中必不可少的基本原则。第M步:从FEy lJ11。。FE的每条句法规则相应地有一条翻译规则(共有17条),它将FE的一个语言成 分翻译成一种逻辑语言(称为内涵逻辑,简记为11-。IL句法是递归定义的,包括基本表达式 及17条规则)中的一个逻辑表达式,这个翻译过程是一(个语言成分)对应一(个逻辑式),符 合组合原则,但简单语言成分对应的逻辑表达式并不简单,不妨将它看成一个部件,部件组合的过 程仍然符合组合原则,最终将FE中的一个(复杂的)语言表达式翻译成IL中的一个(复杂的) 逻辑式——公式。这个公式的最初形式是一个高阶逻辑式,含有人一表达式、高阶逻辑量词,经过 一系列的计算规则化简成一阶谓词逻辑公式。第三步:语义解释。IL的语义(解释)规则共有1 0条,它是针对11。的句法组成递归定义的。对每个11。中的逻辑公式在给定的模型下按规则 求出语义值,称为模型论解释。这个解释是对英语表达式的一个间接的(推导出的、蕴涵的)语义 解释。可计算性就体现在FE句法定义、FE到IL的翻译、IL句法定义、IL语义规则这几个 方面,都是可以逐步操作、逐步计算的。FE至IL的翻译不是本质的,如果换一种处理方法也可 得到同样的效果。但是它在技术上是很成功的。它是逐词、逐短语、逐句的翻译和化简的。例句“ xmanwalks”的翻译过程如下:(1)a=>AQ[XP3x[Q{x}八P{x}]] (根据基本表达式翻译规则)。限定词a、every、the以及普通名词man,动词wal k等词典中的词汇都由基本表达式翻译规则译成各自对应的基本表达式。公式中入Q,人P称为人 一抽象,表示公式中Q(X}和P(X}是两个未知谓词,待到后面步骤中逐个代入具体的谓词。 先代入Q,普通名词man对应的谓词。后代入P,动词walk对应的谓词。翻译后的公式告诉 我们:限定词a是什么呢?语法上它后面一定跟普通名词,再跟谓语动词;语义上是指至少存在一 个个体X,X既有普通名词规定的性质,又有谓语动词所规定的性质。(2)man。man‘( 根据基本表达式翻译规则,普通名词man译成基本表达式:谓词man’。)(3)aman。 AQ「AP3x[Q{x}AP{x}]](”man’)(根据短语合成对应的表达式毗连运算 规则),表达式(1)“作用”在表达式(2)的“内涵”上,用”表示内涵式,见第四节。)上 式一>AP3X[m。n’(X)八P{X}](根据人一化简规则,要消去Q,需要将m。11 ’代入到公式中Q的所有出现位置上。符号”遇到花括号两者消去(技术细节,略)。上述公式是 化简结果。与(1)式比较,(1)式中两个未知谓词至此已经确定了其中的一个Q,代入了具体 的谓词man’。)(4)walk。walk‘(根据基本表达式翻译规则,动词译成谓词。了 (5)amanwalks。AP3x[man’(x)八P{x}」(”walk’)(根据仿 上述(3),短语合成对应毗连运算规则,(3)式作用在(4)式内涵上。)(6)上式。3x [man’(x)Awalk’(x)I(根据人一演算的化简规则,将谓词walk’代入到(5)式中P的所有出现,消去P;符号”与花括号同时消去,得到上式,一阶谓词公式。至此,(l)式中两个未知谓词已全部代入具体谓词,一是man‘,一是walk’。)需要说明几点:1.将英语例句翻译成谓词公式,不能以为这就是英语的语义解释了。实际上公式(6)记为a,
More summaries about the 黄昌宁、林杏光主持:“信息处理用语言理论讲话”第六讲──蒙太古语义学