PG电子收藏 术语库概念及合集术语库是为了有效地利用和管理层出不穷的术语而创建的术语容器。近十几年来,信息技术的发展给翻译行业带来了巨大的变化,计算机辅助翻译技术被越来越多地运用到翻译工作中来,其中术语管理是计算机辅助翻译的核心技术之一,熟练地掌握术语库可以帮助职业议员提高翻译效率和质量。
术语库是“术语数据库”(terminoloical database)的简称,有时可写作“term base”或“termbase”,指的是存储术语信息的数据库,也被称为自动化词典。在各式各样的术语库当中,翻译术语库是需要重点学习的。
(1)保持术语一致性:术语一致性一直以来都是翻译工作中的难题,不一致的核心术语会严重影响译文质量和读者的阅读体验。与传统的校对工作不同,添加了翻译术语库的计算机辅助翻译工具能够在翻译过程中自动识别术语,即便是对于规模较大、多人协作的翻译任务,也能在很高程度上保持译文中术语的一致性。
(2)提高翻译效率和质量:译者作为一个个体,不可能通晓各大领域的海量术语。伴随着计算机辅助翻译技术越发成熟,术语库的建立大大减轻了译者查阅专业书籍确定术语的负担,译者在翻译实践中PG电子(中国)官方网站,如果能够管理和及时更新术语库,可以极大地提高翻译的效率和质量。
在开始翻译项目前,先要以统一格式提取项目中的术语。memoQ、Déjà Vu、SDL MultiTerm,语帆术语宝 (Termbox) 等工具可用于提取术语,上节课的同学已详细说明。
提取术语后要对术语进行整理,为术语导入术语库做准备。并且可以进行术语定义,即对收集到的术语进行解释说明,这样可以帮助后面使用该术语库的人理解术语。下面是整理以及定义一个3D打印术语表的案例。
可以先转化为标准的 xlsx文件。表格中,A和B列为语言字段,是术语库的主要组成基础,是必填项;C列为说明性字段,并在首行标记相应语种/说明字段列标题,如下图所示
打开SDL MultiTerm,进入“欢迎向导”。直接点击“下一步”,至第三步时,将转换选项选为“Microsoft Excel格式“,点击下一步。
在第四步”指定文件“页面选择需要转换的输入文件,即前面准备好的Excel术语文件,其他各项文件路径名自动生成,点击”下一步:
然后为标题字段指定类型,对于语言字段,讲英文语言字段需那位English(United States),中文语言字段选为Chinese(Simplified)。Excel表格必须包含表头信息,否则软件会将表格中第一条术语识别为语言字段。
点击“下一步”直至完全转换。转换完成的XML文件默认保存路径与Excel文件的存放路径相同。
世界知识产权组织(World Intellectual Property Organization:WIPO)开发的多语种术语库WIPO PEARL,由世界知识产权组织旗下的语言专家和术语学家开发,包含阿拉伯语、汉语、英语、法语、德语、日语、韩语、葡萄牙语、俄语和西班牙语等十种语言术语。
2020年6月19日更新显示,该数据库现包含超过190,000个术语,已全部由WIPO-PCT语言专家审定。此外,数据库中有20,000个与其紧密相连的关系概念。其概念关系可在概念图搜索中浏览查看。其他关系也可在未经审定的、机器学习算法生成的“概念云”中查看。
WIPO PEARL还提供来自专利文件的科技术语,推动不同语言对术语进行准确性、一致性使用,让科技知识的搜索与分享变得更简单。
世界贸易组织术语库包含世界贸易组织的所有术语,实现了英语PG电子(中国)官方网站、法语和西班牙语的三语术语转换。操作系统可通过中文运行,进行普通、模糊匹配和全文三种形式的搜索。搜索结果包括术语名称、分类、编码等。该数据库于2020年3月更新了版本。
据百度百科,简单知识组织系统(Simple Knowledge Organization System:SKOS)是目前正在发展的对简单知识组织进行描述的语言。常以RDF Schema设计方式来展现与分享其控制的词汇。例如,索引典PG电子(中国)官方网站、分类系统、主题标目表、分类法、术语典、词汇表以及其他型式均可运用语义网络架构来组建词汇。截至2020年7月,AGROVOC已推行SKOS-XL概念方案,并可采用链接数据集(Linked Data set: LD set)进行展示。该数据集包含了超过37,000个概念,提供多达39种语言的服务(available in up to 39 languages)。
通过链接数据,AGROVOC与18个与农业有关的开放数据集进行了对齐。拥有像AGROVOC这样的以链接数据展示的词库优点在于:一旦词库进行链接,其索引资源也得到链接。
对于术语的定义,数据库区分了“首选术语”和“非首选术语”,而且数据库还将同一概念的多语种表示规范在一个标签下。
在术语关系方面,数据库采用定义更宽(BT)和定义更窄(NT)(broader/narrower)的层次关系来表示同义词库的等级关系。采用概念之间的关联性(RT)来表示非等级关系,并引入了自定义的“Agrontology”来表示特定词汇关系。
欧盟互动术语数据库管理小组每年都开几次会,欧洲议会也会派术语协调部(The Terminology Coordination Unit: TermCoord)代表参加。随着技术发展和各机构中术语工作的变化,数据库也不断得到发展并得到有效维护,这些都要求欧盟互动术语数据库不断更新和升级。
术语协调部团队由术语学家、助理员、IT和通信专家以及受训者组成,其主要任务是为欧洲议会的翻译人员提供术语帮助。在此领域中,术语协调部提供并维护欧盟的术语数据库,与翻译部门合作启动和协调术语项目,提供培训,汇编其他有用的资源(例如专业词汇表),提供相关参考文档链接(links to relevant reference documents)的网页,提供可适用于不同语言和许多其他语言音译规则(transliteration rules for different languages and many others)的网页。
数据库的新版本已于2018年11月7日发布,此后将使用最先进的技术(state-of-the-art technologies)、最新的软件开发标准(the latest software development standards),最优化的可用性和可访问性实践(best practices on usability and accessibility)以及全新的外观和系统,对数据库进行全面重建(a full rebuild)。内部用户和公共用户现在已经可以使用许多更新和新功能,并且欧盟机构间术语数据库将在未来几个月和几年中继续发展,以满足欧盟语言学家和数据库用户的需求和愿望。
2020年11月24日最新的版本(Version 2.18.2)实施了新功能,具体包括:对搜索限制进行了修改。例如,内部用户每次查询最多可以查询10,000个搜索结果;外部用户每次查询最多可以查询500个搜索结果;查询结果的总数不设上限。
包含未分类的军事术语以及与北约有关的非军事术语。数据库采用北约两种官方语言(英语和法语),由北约标准化办公室(NATO Standardization Office)下辖的北约术语办公室(NATO Terminology Office)负责维护。
数据库中的术语是通过北约术语计划(NATO Terminology Programme)创建的。该计划提供了术语框架,北约高级委员可借此进行术语的开发和审定。通过北约术语计划审定的术语可作为北约文件和各种通讯(NATO documents and communications of all kinds)的标准术语。