机器翻译研究几十年来吸引了世界众多科学家为之努力奋斗 ,利用机器进行翻译是人类美好的梦想 ,机器翻译也是世界 10大技术难题之一。1 机器翻译研究发展历程1.1 世界上机器翻译研究的发展机器翻译的设想最早是由法国科学家G .B .阿尔楚尼在 2 0世纪 30年代提出的。 194 6年计算机问世不久 ,英、美两位工程师A .D .Booth(布思 )和W .Weaver(沃伦·韦弗 )首次提出了利用计算机来进行翻译 ,并于 194 9年发表《翻译备忘录》。世界上第一次机器翻译试验 (俄 -英 )是 195 4年由美国乔治敦大学和IBM公司进行的。世界上其他一些发达国家也在进行这方面的研究。自 196 6年美国语言自动化处理咨询委员会 (AL PAC)出版了一本几乎否定机器翻译的黑皮书《语言和机器》(ALPAC报告 )后 ,世界范围机译研究在经历了大约 10年的沉寂 ,直到 70年代中期随着计算机技术的迅速发展 ,才得以重焕生机。相继出现了一些商品化的大型机上的机器翻译系统 ,其中有的又开发出PC机型翻译系统。如美国的SYSTRAN系统、ALPS机助翻译系统、WEIDNER英西机助翻译系统 ,美德共同研制的METAL德英翻译系统 ,法国的GETA俄法翻译系统 ,日本ATLAS英日翻译系统等。其中最为著名的是美国的SYSTRAN系统 ,它是由很多对语言组成的翻译系统 ,相对成熟的是俄 -英和法 -英翻译系统 ,笔者所在的中国农科院文献中心机译课题组与该公司曾有过联系。另外 ,PC机翻译、掌上型翻译、电话翻译、因特网翻译等翻译系统产品也相继得到了开发。1.2 我国机器翻译研究的发展195 6年 ,我国开始了机器翻译研究。在《科学发展纲要》、“六五”、“七五”、“八五”和“86 3计划”中 ,国家均把机器翻译列为重点发展项目。我国第一个机器翻译系统试验是 195 9年在中科院语言所和计算所共同研制的俄 -汉翻译系统中进行的。在经历了文革期间的被迫停顿 ,70年代中期的“74 8”工程 ,对机器翻译重新给予了重视。80年代中期到 90年代初期是我国机器翻译第三个重要发展时期。在这一时期 ,研制成功了两个可载入中国机译史册的实用化翻译系统。它们分别是我国军事科学院 1987年研制成功的“KY - 1”(科译 1号 )英汉翻译系统 ,后来被中软公司开发为“译星”
翻译软件 ,这是我国第一个商品化的翻译软件 ,另一个是中科院计算所陈肇雄博士 1992年研制成功的“IMT/EC86 3”英汉机译系统 ,获国家科技进步一等奖 ,它的技术随后产生了非常可观的经济效益。从 90年代初期至今 ,是我国机器翻译研究蓬勃发展的时期 ,研制成功了许多优秀的机器翻译软件。同时开始了一些新的应用领域对话翻译系统等的机器翻译研究。中国机器翻译研究的起步水平不低 ,今天和世界上机译研究发达国家在PC机翻译软件、网上翻译软件开发等方面相比也不为逊色。2 机器翻译研究理论方法概述2 .1 机器翻译系统构成现代机器翻译系统一般由语法规则库、翻译模块和词典库三部分构成。语法 规则库是机器翻译系统的核心。其中成千上万条规则是对自然语言规则的总结和提炼汇集。翻译模 块是计算机实现翻译功能的主要部分。它实现文件编辑、翻译功能、词和句库的构造管理功能。词典库是翻译系统运行的基础,可以根据需要进行扩充。2 .2 计算语言学概述从计算语言学的角度来看 ,实现机器翻译的技术原理主要有基于语法分析和基于语料库两大途径。基于语法分析的技术就是对源语言语句的词法、语义、语法和句法进行分析并判断和取舍 ,然后重新进行排列组合 ,最后生成目标语言。但由于计算机技术发展水平所限 ,这种方法还不能完全模拟人脑的思维功能和适应自然语言的灵活性、复杂性和开放性等特点 ,存在一定缺陷。这种方法在机译研究的初期曾占主导地位。基于语料库的技术工作原理是利用统计学和概率方法建立一个包含各种句型的双语对照语料库 ,在翻译时 ,从语料库中抽取与输入句子相类似的例句 ,然后模仿例句来实现源语言与目标语言的转换。采用这种技术能够得到可读性和准确性都比较好的 译文。但这种方法的难点在于构建庞大语料库及其建立有效的运行机制。这种技术已越来越受到重视并已在很多产品的开发中得到应用。近几年,已有学者试将两种技术相结合用于产品研制。2 .3 机器翻译理论概述从机器翻译理论的角度来看 ,机器翻译的方法有3种 :直接法、转换法和中间语言法。直接法是第一代技术 ,即句子中词汇之间的对译 ,没有进行句法分析。由于译文质量差和应用范围窄 ,这种方法已基本上不使用。转换法是第二代技术 ,它的实现思路就是先对源语进行分析 ,利用大量的转换规则将分析结果转换成中间表达式 ,再由中间表达式生成译文。目前大多数转换规则仍只是对语法结构进行转换 ,缺少深层的语义表示 ,所以用转换法难以进行较深入的分析和推理。中间语言法是第三代技术 ,它是以“独立分析和独立生成”为指导思想。就是把源语言的句子变成某种知识表达式———“中间语言” ,再由“中间语言”生成译语。在此 ,源语的分析与译语的生成完全独立 ,克服了转换法缺乏深层语义分析和表示的缺点。同时 ,系统设计人员不需要再熟悉多种语言 ,而只需能熟练掌握母语即可。但这种方法也存在着许多技术上的问题 ,如一个源语语句可能生成多个“中间语言表达式”等情况。因此 ,有时还需要利用转换法的某些策略。机译研究的一个发展方向是研制转换法和中间语言法相结合的 翻译系统。已有一些研究人员在做这方面的研究工作。3 机器翻译软件概述从笔者了解到的翻译软件,目前国内出品的各类翻译软件产品有近 2 0 0种 ,笔者所在课题组接触过的有十几种。另据有关资料报道 ,世界范围的各类翻译软件产品约有 10 0 0种。从国内翻译软件的应用功能来看 ,可分为汉化和翻译两大类 ,有些软件同时具有两种功能。3.1 汉化类3.1.1 软件汉化 :对英文软件的菜单等信息汉化。“东方快车”等软件有此功能。目前软件汉化工作已很成功实现并得到广泛应用。3.1.2 网页汉化 :对英文网页进行动态汉化。著名的有“东方快车”、“金山快译”等软件。3.2 翻译类3.2 .1 电子词典。它解决了不同语种之间的词汇翻译。形式有PDA、掌上电脑和PC机光盘等形式 ,有的具有即指即译、发声、网上在线翻译词汇等功能。著名有“文曲星”、“商务通”、联想掌上电脑、“金山词霸”、“东方快车”、“看世界”网站等。3.2 .2 全文翻译系统。按使用范围可分为英汉单向、汉英单向和英汉双向翻译三类。按功能可分为自动翻译系统和辅助翻译系统 ,有的软件两者兼有。自动翻译系统由于受技术水平发展限制的原因 ,它的翻译结果还不能十分令人满意 ,但可作为人们大致浏览信息之用。由于上述原因 ,目前在国外专业翻译领域全文翻译系统的主流产品是计算机辅助翻译系统。其目的就是为了减轻劳动强度 ,提高工作效率 ,充分利用电脑的资源 ,避免重复劳动。它的核心技术是由机器翻译 (MT -MachineTranslation)向翻译记忆 (Transla tionMemory)转变。其工作原理是将用户翻译的内容 ,自动存入系统的翻译记忆库中 ,以后翻译时遇相同的句子等 ,系统自动给出翻译结果 ,若遇相似的句子 ,系统可自动给出翻译建议和参考译例 ,用户稍加修改即可完成翻译过程 ;同时翻译记忆库在后台它不断学习和自动储存新的译文 ,将变得越来越“聪明” ,效率越来越高 ;同时采用智能分析与人机交互技术 ,达到降低工作强度 ,提高工作效率的目的。在国外该类型软件处于领先地位的是德国塔多思 (TRADOS)公司的产品。在国内该类型软件处于领先地位的是北京雅信诚软件技术有限公司的产品 ,他们的产品是国内首个集记忆、交互、分析于一体的辅助翻译平台。与塔多思公司的产品相比 ,雅信诚公司产品的优势在于它多一个具有 6 0 0多万条英汉双向词汇的词库 ,大大方便了国内用户的使用 ,塔多思公司产品则需要用户自己去添加词库 ,而一般用户做不到这一点。4 发展前景世界机器翻译研究已走过了 5 0多年的曲折历程 ,目前一些翻译软件产品基本上已达到了实用水平。其中包括笔者所在单位和北京雅信诚软件技术有限公司合作研制的产品“龙方雅信CAT”。随着世界网络化的发展 ,信息交流日益频繁 ,其中英文信息已占统治地位。对于目前不熟悉英语的人 ,特别是我国广大农村地区 ,这一语言交流问题日显突出。国内从事科研活动的人员在不断增长。据报道 ,中国目前有 10 0万翻译人员 ,其中科技翻译人员约 4 0万人。另据美国ABI公司调查 ,2 0 0 0年世界翻译市场规模已达 130亿美元。我国加入WTO后 ,国内企业将面临全球化竞争。同时国际质量认证组织ISO 90 0 2明确要求 ,提供翻译服务的公司必须掌握和使用翻译软件。以上这些都将大大地刺激机器翻译需求的增长 ,为机器翻译的发展创造了机会 ,机器翻译的市场和空间是非常巨大的。可以相信 ,随着机器翻译研究和计算机技术的不断深入发展 ,终将有一天 ,世界上不同语种国家的人们可以借助机器翻译产品达到在各种场合自然无障碍的交流机器翻译发展 概况@卢文林$中国农业科学院科技文献信息中心!北京100081机器翻译;;
计算语言学;;
机器翻译理论;;翻译软件本文论述机器翻译的发展历程,分析机器翻译理论与方法和国内外机器翻译的研制现状、其主要软件组成和相关产品 ,阐明了机器翻译系统的发展前景环ㄈ狈ι畈阌镆宸治龊捅硎镜娜钡恪M?,系统设计人员不需要再熟悉多种语言 ,而只需能熟练掌握母语即可。但这种方法也存在着许多技术上的问题 ,如一个源语语句可能生成多
More reviews about the 机器翻译发展概况